Zhengyang Tang (唐正阳)

About Me

I am a Ph.D. candidate at The Chinese University of Hong Kong, Shenzhen (CUHK-Shenzhen), advised by Prof. Benyou Wang. I've had the privilege of working with amazing teams at Alibaba (Qwen Team), Microsoft Research Asia (MSRA), and Tencent.

Research: My research focuses on developing intelligent agents capable of complex reasoning and self-improvement. I pioneer agentic frameworks that leverage reinforcement learning (RL) for tool-integrated tasks in my work on CoRT (NeurIPS'25) and STORM. To enable self-improvement, my SCRIT framework (COLM'25) introduces a self-evolving critique model—a form of generative reward model—for scalable oversight without external supervision.

My research program also establishes the foundations for these advanced models. I have designed novel instruction tuning frameworks—MathScale (ICML'24), GLAN (TMLR'25), and ALAN (ACL'25)—to generate high-quality training data at scale. Additionally, my work on DPTDR (COLING'22) ensures these agents can access information efficiently, achieving top rankings on competitive benchmarks.

I am actively seeking full-time research or engineering roles starting around July 2026. Feel free to reach out!

Selected Publications

Qwen3 Technical Report Qwen Team (My Contribution: Tool-integrated Reasoning). Technical Report, 2025. [Paper] [Code]

CALM Before the STORM: Unlocking Native Reasoning for Optimization Modeling Zhengyang Tang*, Zihan Ye*, Chenyu Huang*, Xuhan Huang, Chengpeng Li, Sihang Li, Guanhua Chen, Ming Yan, Zizhuo Wang, Hongyuan Zha, Dayiheng Liu, Benyou Wang. arXiv preprint, 2025. [Paper]

CoRT: Code-integrated Reasoning within Thinking Chengpeng Li*, Zhengyang Tang*, Ziniu Li*, Mingfeng Xue, Keqin Bao, Tian Ding, Ruoyu Sun, Benyou Wang, Xiang Wang, Junyang Lin, Dayiheng Liu. The 39th Conference on Neural Information Processing Systems (NeurIPS), 2025. [Paper]

Self-Evolving Critique Abilities in Large Language Models (SCRIT)) Zhengyang Tang*, Ziniu Li*, Zhenyang Xiao*, Tian Ding, Ruoyu Sun, Benyou Wang, Dayiheng Liu, Fei Huang, Tianyu Liu, Bowen Yu, Junyang Lin. The 2nd Conference on Language Modeling (COLM), 2025. [Paper]

Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion Jianqing Zhu*, Huang Huang*, Zhihang Lin*, Juhao Liang*, Zhengyang Tang*, Khalid Almubarak, Abdulmohsen Alharthik, Bang An, Juncai He, Xiangbo Wu, Fei Yu, Junying Chen, Zhuoheng Ma, Yuhao Du, He Zhang, Emad A. Alghamdi, Lian Zhang, Ruoyu Sun, Haizhou Li, Benyou Wang, Jinchao Xu. The 63rd Annual Meeting of the Association for Computational Linguistics (ACL), 2025. (Oral & Panel) [Paper] [Model]

ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling Chenyu Huang*, Zhengyang Tang*, Shixi Hu, Ruoqing Jiang, Xin Zheng, Dongdong Ge, Benyou Wang, Zizhuo Wang. Operations Research (OR), 2025. [Paper] [Code] [Demo]

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models (GLAN) Haoran Li*, Qingxiu Dong*, Zhengyang Tang*, Chaojun Wang*, Xingxing Zhang, Haoyang Huang, Shaohan Huang, Xiaolong Huang, Zeqiang Huang, Dongdong Zhang, Yuxian Gu, Xin Cheng, Xun Wang, Si-Qing Chen, Li Dong, Wei Lu, Zhifang Sui, Benyou Wang, Wai Lam, Furu Wei. Transactions on Machine Learning Research (TMLR), 2025. [Paper]

MathScale: Scaling Instruction Tuning for Mathematical Reasoning Zhengyang Tang, Xingxing Zhang, Benyou Wang, Furu Wei. The 41st International Conference on Machine Learning (ICML), 2024. [Paper] [Code]

DPTDR: Deep Prompt Tuning for Dense Passage Retrieval Zhengyang Tang, Benyou Wang, Ting Yao. The 29th International Conference on Computational Linguistics (COLING), 2022. [Paper] [Code]

Experiences

Oct 2024 - Present, Research Intern, Qwen Team, Alibaba.

Mentor: Dayiheng Liu

Jun 2023 - Dec 2023, Research Intern, Microsoft Research Asia (MSRA).

Mentors: Xingxing Zhang; Furu Wei

Jan 2023 - Present, Ph.D. Candidate, The Chinese University of Hong Kong, Shenzhen.

Supervisor: Prof. Benyou Wang

Aug 2020 - Jan 2023, Senior Researcher (T10), Tencent.

May 2019 - Aug 2020, Algorithm Engineer II (P6), Alibaba Group.

Jan 2018 - Jul 2019, Graduate Student (SCPD), Stanford University.

Aug 2016 - May 2019, Algorithm Engineer, CreditX Technology.

Mentor: Mingjie Zhu

Sep 2012 - Jul 2016, Bachelor of Engineering, Tongji University.

Invited Talks & Media

Media Coverage for ORLM: Featured by Cardinal-AI and CUHK-Shenzhen.

Invited Talk at ICML 2024: "MathScale: Scaling Instruction Tuning for Mathematical Reasoning". [Slides]

Invited Talk at Baidu Search (2022): "DPTDR: Deep Prompt Tuning for Dense Passage Retrieval".

Zhengyang Tang (唐正阳)

About Me

Selected Publications

Experiences

Invited Talks & Media

Patents

Honors & Awards

Curriculum Vitae