📝 Publications

Preprint

Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation. Zhipeng Liang*, Xiaoteng Ma*, Jose Blanchet, Mingwen Liu, Li Xia, Jiheng Zhang, Qianchuan Zhao, Zhengyuan Zhou

Single-Trajectory Distributionally Robust Reinforcement Learning. Zhipeng Liang*, Xiaoteng Ma*, Jose Blanchet, Jiheng Zhang, Zhengyuan Zhou, International Conference on Machine Learning (ICML), 2024.
Privacy Matters: Vertical Federated Linear Contextual Bandits for Privacy Protected Recommendation. Zeyu Cao*, Zhipeng Liang*, Shu Zhang, Hangyu Li, Ouyang Wen, Yu Rong, Peilin Zhao, Bingzhe Wu. SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2023.
UMIX: Improving Importance Weighting for Subpopulation Shift via Uncertainty-Aware Mixup. Zongbo Han*, Zhipeng Liang*, Fan Yang*, Liu Liu, Lanqing Li, Yatao Bian, Peilin Zhao, Bingzhe Wu, Changqing Zhang, Jianhua Yao. Advances in Neural Information Processing Systems (NeurIPS), 2022. Spotlight
Optimal Private Streaming SCO in $\ell_p$-geometry with Applications in High Dimensional Online Decision Making. Yuxuan Han*, Zhicong Liang*, Zhipeng Liang*, Yuan Yao, Yang Wang, Jiheng Zhang. International Conference on Machine Learning (ICML), 2022.
Generalized Linear Bandits with Local Differential Privacy. Yuxuan Han*, Zhipeng Liang*, Wang Yang, Jiheng Zhang. Advances in Neural Information Processing Systems (NeurIPS), 2021.