📝 Selected Publications

Tool-Learning Agent

Technical Report UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning, ByteDance Seed Team.
Technical Report Retool: Reinforcement learning for strategic tool use in llms, Jiazhan Feng*, Shijue Huang*, Xingwei Qu, Ge Zhang, Yujia Qin, Baoquan Zhong, Chengquan Jiang, Jinxin Chi, Wanjun Zhong.
Technical Report UI-TARS: Pioneering Automated GUI Interaction with Native Agents, Yujia Qin, Yining Ye, Junjie Fang, Haoming Wang, Shihao Liang, Shizuo Tian, Junda Zhang, Jiahao Li, Yunxin Li, Shijue Huang, Wanjun Zhong, Kuanye Li, Jiale Yang, Yu Miao, Woyu Lin, Longxiang Liu, Xu Jiang, Qianli Ma, Jingyu Li, Xiaojun Xiao, Kai Cai, Chuang Li, Yaowei Zheng, Chaolin Jin, Chen Li, Xiao Zhou, Minchao Wang, Haoli Chen, Zhaojian Li, Haihua Yang, Haifeng Liu, Feng Lin, Tao Peng, Xin Liu, Guang Shi
Arxiv Acting Less is Reasoning More! Teaching Model to Act Efficiently, Hongru Wang, Cheng Qian, Wanjun Zhong, Xiusi Chen, Jiahao Qiu, Shijue Huang, Bowen Jin, Mengdi Wang, Kam-Fai Wong, Heng Ji.
ACL 2024 (Findings) Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios, Shijue Huang, Wanjun Zhong, Jianqiao Lu, Qi Zhu, Jiahui Gao, Weiwen Liu, Yutai Hou, Xingshan Zeng, Yasheng Wang, Lifeng Shang, Xin Jiang, Ruifeng Xu, Qun Liu.

Arxiv AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting, Shijue Huang, Hongru Wang, Wanjun Zhong, Zhaochen Su, Jiazhan Feng, Bowen Cao, Yi R Fung.
AAAI 2025 (Oral) Empowering Self-Learning of LLMs: Inner Knowledge Explicitation as a Catalyst, Shijue Huang, Wanjun Zhong, Deng Cai, Fanqi Wan, Chengyi Wang, Mingxuan Wang, Mu Qiao, Ruifeng Xu.
ACL 2025 (Findings) Self-reasoning language models: Unfold hidden reasoning chains with few reasoning catalyst, Hongru Wang, Deng Cai, Wanjun Zhong, Shijue Huang, Jeff Z Pan, Zeming Liu, Kam-Fai Wong.
Arxiv Let Large Languague Models Find the Data to Train Themselves, Fanqi Wan, Deng Cai, Shijue Huang, Xiaojun Quan, Mingxuan Wang.
EMNLP 2023 Cross-lingual Prompting: Improving Zero-shot Chain-of-Thought Reasoning across Languages, Libo Qin, Qiguang Chen, Fuxuan Wei, Shijue Huang, Wanxiang Che.