📝 Selected Publications（Full List）

Tool-Learning Agent

Arxiv Towards On-Policy Data Evolution for Visual-Native Multimodal Deep Search Agents, Shijue Huang, Hangyu Guo, Guanting Dong, Chenxin Li, Junting Lu, Xinyu Geng, Zhaochen Su, Zhenyu Li, Shuang Chen, Hongru Wang, Yi R Fung.
ICLR 2026 Retool: Reinforcement learning for strategic tool use in llms, Jiazhan Feng*, Shijue Huang*, Xingwei Qu, Ge Zhang, Yujia Qin, Baoquan Zhong, Chengquan Jiang, Jinxin Chi, Wanjun Zhong.
Technical Report Seed 2.0 Model Card: Towards Intelligence Frontier for Real-World Complexity, ByteDance Seed Team.
Technical Report Seed1.8 Model Card: Towards Generalized Real-World Agency, ByteDance Seed Team.
Technical Report UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning, ByteDance Seed Team.
Technical Report UI-TARS: Pioneering Automated GUI Interaction with Native Agents, Yujia Qin, Yining Ye, Junjie Fang, Haoming Wang, Shihao Liang, Shizuo Tian, Junda Zhang, Jiahao Li, Yunxin Li, Shijue Huang, Wanjun Zhong, Kuanye Li, Jiale Yang, Yu Miao, Woyu Lin, Longxiang Liu, Xu Jiang, Qianli Ma, Jingyu Li, Xiaojun Xiao, Kai Cai, Chuang Li, Yaowei Zheng, Chaolin Jin, Chen Li, Xiao Zhou, Minchao Wang, Haoli Chen, Zhaojian Li, Haihua Yang, Haifeng Liu, Feng Lin, Tao Peng, Xin Liu, Guang Shi
Arxiv Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence, Guanting Dong, Junting Lu, Junjie Huang, Wanjun Zhong, Longxiang Liu, Shijue Huang, Zhenyu Li, Yang Zhao, Xiaoshuai Song, Xiaoxi Li, Jiajie Jin, Yutao Zhu, Hanbin Wang, Fangyu Lei, Qinyu Luo, Mingyang Chen, Zehui Chen, Jiazhan Feng, Ji-Rong Wen, Zhicheng Dou.
Arxiv AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios, Zhaochen Su, Jincheng Gao, Hangyu Guo, Zhenhua Liu, Lueyang Zhang, Xinyu Geng, Shijue Huang, Peng Xia, Guanyu Jiang, Cheng Wang, Yue Zhang, Yi R. (May) Fung, Junxian He.
Arxiv Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows, Chenxin Li, Zhengyang Tang, Huangxin Lin, Yunlong Lin, Shijue Huang, Shengyuan Liu, Bowen Ye, Rang Li, Lei Li, Benyou Wang, Yixuan Yuan.
Arxiv Acting Less is Reasoning More! Teaching Model to Act Efficiently, Hongru Wang, Cheng Qian, Wanjun Zhong, Xiusi Chen, Jiahao Qiu, Shijue Huang, Bowen Jin, Mengdi Wang, Kam-Fai Wong, Heng Ji.
ACL 2024 (Findings) Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios, Shijue Huang, Wanjun Zhong, Jianqiao Lu, Qi Zhu, Jiahui Gao, Weiwen Liu, Yutai Hou, Xingshan Zeng, Yasheng Wang, Lifeng Shang, Xin Jiang, Ruifeng Xu, Qun Liu.

Large Language Model Reasoning

TMLR AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting, Shijue Huang, Hongru Wang, Wanjun Zhong, Zhaochen Su, Jiazhan Feng, Bowen Cao, Yi R Fung.
ICLR 2026 From Abstract to Contextual: What LLMs Still Cannot Do in Mathematics, Bowen Cao, Dongdong Zhang, Yixia Li, Junpeng Liu, Shijue Huang, Chufan Shi, Hongyuan Lu, Yaokang Wu, Guanhua Chen, Wai Lam, Furu Wei.
ICLR 2026 Ares: Multimodal adaptive reasoning via difficulty-aware token-level entropy shaping, Shuang Chen, Yue Guo, Yimeng Ye, Shijue Huang, Wenbo Hu, Haoxi Li, Manyuan Zhang, Jiayu Chen, Song Guo, Nanyun Peng.
AAAI 2025 (Oral) Empowering Self-Learning of LLMs: Inner Knowledge Explicitation as a Catalyst, Shijue Huang, Wanjun Zhong, Deng Cai, Fanqi Wan, Chengyi Wang, Mingxuan Wang, Mu Qiao, Ruifeng Xu.
ACL 2025 (Findings) Self-reasoning language models: Unfold hidden reasoning chains with few reasoning catalyst, Hongru Wang, Deng Cai, Wanjun Zhong, Shijue Huang, Jeff Z Pan, Zeming Liu, Kam-Fai Wong.
EMNLP 2023 Cross-lingual Prompting: Improving Zero-shot Chain-of-Thought Reasoning across Languages, Libo Qin, Qiguang Chen, Fuxuan Wei, Shijue Huang, Wanxiang Che.

Shijue Huang

📝 Selected Publications（Full List）

Tool-Learning Agent

Large Language Model Reasoning