AI智能体必读文献清单(按学习优先级排序)

这份清单兼顾快速建立全局认知掌握核心技术范式把握最新发展趋势三大核心需求,优先推荐高引用、高权威性的顶会/顶刊综述与里程碑论文,覆盖从入门到前沿的全路径。
在这里插入图片描述

一、入门必看·全局综述(优先阅读,1-2篇即可快速掌握发展脉络与核心趋势)

这类文献帮你跳过零散知识点,直接建立体系化认知,是把握行业趋势的最快路径。

论文名称 核心机构/作者 发表时间 核心价值与必读理由
Agent AI: Surveying the Horizons of Multimodal Interaction 李飞飞团队(斯坦福大学+微软) 2025 行业公认的2025年Agent领域标杆综述,近80页篇幅。统一了智能体的核心定义,打破NLP、CV、机器人学的领域壁垒,提出「感知-决策-行动」的新一代多模态智能体完整范式,明确了落地挑战与未来10年研究方向,是把握当前技术演进的核心文献
The Rise and Potential of Large Language Model Based Agents: A Survey 复旦大学NLP团队 2023 LLM驱动智能体领域的开山级综述,引用量超万次。首次提出「大脑-感知-行动」的通用智能体框架,系统梳理了单智能体、多智能体、人机协作、智能体社群四大核心场景,是所有入门者的必看奠基文献
From Language to Action: A Review of Large Language Models as Autonomous Agents and Tool Users 国际顶刊Q1分区 2026年2月(最新) 覆盖2023-2025年所有A*/A类顶会核心成果,拆解了智能体架构设计、单/多智能体系统、工具集成、认知机制(推理/规划/记忆)四大核心模块,配套68个公开数据集的评估分析,最终给出10个明确的未来研究方向,是把握2026年最新趋势的一手指南
A Survey on Large Language Model based Autonomous Agents 中国人民大学高瓴人工智能学院 2024 引用量近千次的工程向标杆综述。从「构建-应用-评估」三大维度,建立了智能体的标准化研究框架,系统拆解了记忆、规划、工具调用三大核心能力的实现路径,对技术落地和工程开发有极强的参考价值
Advances and Challenges in Foundation Agents MetaGPT联合全球20家顶尖机构(含Mila、耶鲁、谷歌DeepMind等) 2025 264页超长篇史诗级综述,首次定义**「基础智能体(Foundation Agent)** 概念,从脑启发认知架构、终身进化系统、多智能体协作、安全对齐等全维度,构建了通用智能体的终极技术蓝图,适合想深入理解智能体长期演进方向的读者

二、奠基性里程碑论文(理解LLM智能体的核心范式,必看核心3篇)

这些论文定义了现代LLM智能体的基础范式,是所有后续技术演进的源头。

  1. ReAct: Synergizing Reasoning and Acting in Language Models
    谷歌团队,2023年ICLR顶会。LLM智能体的技术基石,首次将「推理(Reasoning)」与「行动(Acting)」深度融合,让大模型可以同步生成推理轨迹和可执行的环境动作,彻底打破了大模型「只思考不行动」的局限,目前几乎所有主流智能体系统都基于这一范式构建。
  2. Reflexion: Language Agents with Verbal Reinforcement Learning
    普林斯顿+谷歌DeepMind,2023年。智能体自我迭代能力的奠基之作,提出了「反思-优化」的闭环机制,让智能体可以通过自我复盘、环境反馈、错误修正持续优化行为,实现了类人的学习迭代能力,是后续自我进化、Agentic RL等方向的核心理论基础。
  3. AutoGPT: Autonomous GPT-4
    开源社区,2023年。首个工程化落地的自主智能体标杆,首次完整实现了「任务自主分解-多步规划-工具调用-循环执行-结果校验」的全流程自主范式,验证了LLM作为通用智能体核心大脑的可行性,直接引爆了LLM智能体的研发浪潮。

三、核心技术方向·细分必读(按需选择,精准把握细分领域趋势)

1. 多智能体协作(群体智能核心方向)

  • Large Language Model Based Multi-agents: A Survey of Progress and Challenges》(IJCAI 2024):多智能体领域最权威的综述,提出了多智能体系统的通用架构,拆解了感知、规划、执行、通信四大核心模块,覆盖了从双智能体交互到智能体社群的全场景,是理解多智能体技术的核心文献。
  • 《Scaling Large Language Model-based Multi-Agent Collaboration》(2024):聚焦多智能体规模化协作的核心论文,解决了多智能体角色分工、通信效率、任务协同、冲突消解四大核心问题,是企业级多智能体系统开发的必读指南。

2. 智能体规划与推理(决策能力的核心)

  • Understanding the Planning of LLM Agents: A Survey》(2024):唯一一篇专门聚焦智能体规划能力的权威综述,梳理了从链式思维(CoT)到蒙特卡洛树搜索(MCTS)、从单步规划到长期闭环规划的全演进路径,明确了规划能力的核心瓶颈与未来突破方向。
  • 《Agentic Reasoning for Large Language Models》(2026年1月最新):宣告了大模型从「静态推理」到「智能体推理(Agentic Reasoning)」的范式革命,构建了智能体推理的三维框架,是2026年推理方向的最新趋势指南。

3. 自我进化与Agentic RL(前沿核心赛道)

  • The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》(2025年9月):100页重磅综述,系统梳理了500+前沿研究,首次为「智能体强化学习(Agentic RL)」建立完整理论框架,明确了LLM从「被动文本生成器」到「动态环境中的自主决策者」的范式跃迁,是当前最火的技术方向必读文献。
  • 《A Comprehensive Survey of Self-Evolving AI Agents》(2025):自我进化智能体领域的标杆综述,定义了「终身自主优化」的智能体范式,提出了自我进化智能体的三大安全法则,覆盖了单智能体优化、多智能体协同进化的全场景,是智能体长期演进的核心指南。

四、经典理论溯源(选读,理解智能体的本源理论)

如果想彻底理解智能体的理论根基,必读这篇开山之作:
Intelligent Agents: Theory and Practice(Wooldridge & Jennings,1995)
智能体领域的「圣经级」论文,首次系统定义了智能体的核心概念、BDI(信念-愿望-意图)理论模型、理性决策框架,是所有现代智能体研究的理论源头,帮你彻底理解「智能体到底是什么」的本质问题。

阅读顺序建议

  1. 快速入门:先读李飞飞团队《Agent AI》综述,1天建立全局认知,把握核心趋势;
  2. 夯实基础:再读复旦综述+ReAct、Reflexion两篇奠基论文,理解核心范式;
  3. 聚焦细分:根据你的研究/开发方向,选择多智能体、规划推理、Agentic RL等细分方向的文献;
  4. 把握最新趋势:精读2026年最新的两篇综述,同步行业最前沿的研究方向。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐