🧩 Introduction — 引言

English Original

For a long time, humanity has pursued artificial intelligence (AI) equivalent to or surpassing human level, with AI agents considered as a promising vehicle of this pursuit. AI agents are artificial entities that sense their environment, make decisions, and take actions.

中文译文

长期以来,人类一直在追求能够达到或超越人类智能水平的人工智能(AI),而AI智能体(AI agents)被认为是实现这一目标的重要载体
AI智能体是一种能够感知环境、进行决策并采取行动的人工实体

💡 关键词

  • AI agent:人工智能体,具备感知–决策–行动三阶段闭环。
  • promising vehicle:有潜力的载体,暗示智能体是通往AGI的路径。

English Original

Due to the versatile and remarkable capabilities they demonstrate, large language models (LLMs) are regarded as potential sparks for Artificial General Intelligence (AGI), offering hope for building general AI agents. Many research efforts have leveraged LLMs as the foundation to build AI agents and have achieved significant progress.

中文译文

由于其多样化且卓越的能力,大型语言模型(LLMs)被视为通向通用人工智能(AGI)的潜在火花,为构建通用型AI智能体带来了新的希望。
许多研究工作已经基于LLM构建智能体体系,并取得了显著进展。

💡 关键词

  • AGI (Artificial General Intelligence):通用人工智能,指具有人类水平的广义智能。
  • leveraged LLMs as the foundation:以LLM为基础搭建智能体体系。

English Original

In this repository, we provide a systematic and comprehensive survey on LLM-based agents, and list some must-read papers.

中文译文

在本仓库中,我们提供了一份系统而全面的基于LLM的智能体综述,并列出了若干必读论文

💡 关键词

  • systematic and comprehensive survey:系统且全面的综述(说明本文不仅做总结,还构建框架)。

English Original

Specifically, we start by the general conceptual framework for LLM-based agents: comprising three main components: brain, perception, and action, and the framework can be tailored to suit different applications.

中文译文

具体而言,我们首先提出了一个LLM智能体的一般概念框架,它包含三个核心组成部分:
大脑(brain)感知(perception)行动(action)
这一框架可以根据不同的应用场景进行灵活定制

💡 结构注释

  • brain → LLM的推理、规划与记忆模块。
  • perception → 感知层,如多模态输入、环境观察、工具调用反馈。
  • action → 执行层,如代码执行、工具操作、环境交互。

English Original

Subsequently, we explore the extensive applications of LLM-based agents in three aspects: single-agent scenarios, multi-agent scenarios, and human-agent cooperation.

中文译文

随后,我们从三个方面系统探讨了LLM智能体的广泛应用

  1. 单智能体场景(single-agent scenarios)
  2. 多智能体场景(multi-agent scenarios),以及
  3. 人机协作场景(human-agent cooperation)

💡 说明

  • 这是后续章节的结构线索(相当于综述的主体部分)。
  • 与 Andrew Ng 在《Agentic AI Workflow》中强调的“individual–multi–human-in-loop”三层框架一致。

English Original

Following this, we delve into agent societies, exploring the behavior and personality of LLM-based agents, the social phenomena that emerge when they form societies, and the insights they offer for human society.

中文译文

接着,我们深入探讨智能体社会(agent societies),研究LLM智能体的行为特征与人格特征,它们在形成群体时出现的社会现象,以及这些现象对人类社会的启示

💡 扩展理解

  • “agent society” 研究的是当多个LLM智能体长期交互时的集体现象,例如社会分工、舆论演化、群体协作等。

English Original

Finally, we discuss a range of key topics and open problems within the field.

中文译文

最后,我们讨论了该领域中的若干关键议题与开放问题

💡 关键词

  • open problems:仍待研究的问题,如多智能体稳定性、长期记忆一致性、安全与伦理问题。

English Original

We greatly appreciate any contributions via PRs, issues, emails, or other methods.

中文译文

我们诚挚欢迎通过PR、Issue、电子邮件或其他方式的贡献与讨论。


🧱 结构总结(Structure Overview)

模块 内容 关键词
背景 人类对通用智能的追求 AGI, AI agent
动机 LLM作为AGI火花 LLM foundation
内容目标 系统综述与论文清单 survey, must-read papers
框架 三要素模型:大脑-感知-行动 brain, perception, action
应用层面 单体、多体、人机协作 single-agent, multi-agent, human-agent
群体智能 智能体社会、行为、人格 agent societies
未来方向 开放问题与研究议题 open problems

🧭 Table of Contents — 目录总览

The Rise and Potential of Large Language Model Based Agents: A Survey
基于大型语言模型的智能体崛起与潜力:综述


🔔 News

最新动态

🌟 Introduction

引言


1️⃣ The Birth of An Agent: Construction of LLM-based Agents

智能体的诞生:基于LLM的智能体构建

🧩 这一章探讨“LLM如何成为智能体的核心”,即“从语言模型到行动主体”的机制转变。
三大模块:大脑(Brain)、感知(Perception)、行动(Action)。


1.1 Brain: Primarily Composed of An LLM

大脑:主要由LLM构成

1.1.1 Natural Language Interaction

自然语言交互

  • High-quality generation 高质量生成
  • Deep understanding 深层理解
1.1.2 Knowledge

知识体系

  • Pretrain model 预训练模型
  • Linguistic knowledge 语言知识
  • Commonsense knowledge 常识知识
  • Actionable knowledge 可操作知识
  • Potential issues of knowledge 知识潜在问题
1.1.3 Memory

记忆机制

  • Memory capability 记忆能力
  • Raising the length limit of Transformers 扩展Transformer上下文长度限制
  • Summarizing memory 记忆摘要化
  • Compressing memories with vectors or data structures 使用向量或数据结构压缩记忆
  • Memory retrieval 记忆检索
1.1.4 Reasoning & Planning

推理与规划

  • Reasoning 推理
  • Planning 规划
  • Plan formulation 计划制定
  • Plan reflection 计划反思
1.1.5 Transferability and Generalization

迁移性与泛化能力

  • Unseen task generalization 未见任务泛化
  • In-context learning 上下文学习
  • Continual learning 持续学习

1.2 Perception: Multimodal Inputs for LLM-based Agents

感知:面向LLM智能体的多模态输入

  • 1.2.1 Visual 视觉感知
  • 1.2.2 Audio 听觉感知

💡 此部分对应“智能体如何接收世界的信息”,即从文本到多模态(图像、语音、视频)的扩展。


1.3 Action: Expand Action Space of LLM-based Agents

行动:扩展LLM智能体的动作空间

  • 1.3.1 Tool Using 工具使用
  • 1.3.2 Embodied Action 具身行动(如机器人控制)

💡 对应“智能体如何影响世界”——从生成文本到操控工具、执行指令、操作机器人。


2️⃣ Agents in Practice: Applications of LLM-based Agents

实践中的智能体:LLM智能体的应用场景

🧩 三大视角:单智能体、多智能体、人机协作。


2.1 General Ability of Single Agent

单智能体的通用能力

  • 2.1.1 Task-oriented Deployment 任务导向部署
  • 2.1.2 Innovation-oriented Deployment 创新导向部署
  • 2.1.3 Lifecycle-oriented Deployment 生命周期导向部署

2.2 Coordinating Potential of Multiple Agents

多智能体的协同潜力

  • 2.2.1 Cooperative Interaction for Complementarity 协作交互以互补
  • 2.2.2 Adversarial Interaction for Advancement 对抗交互以提升

💡 多智能体研究通常模拟人类社会协作与博弈,如“合作–竞争”双驱动系统。


2.3 Interactive Engagement between Human and Agent

人机交互协作

2.3.1 Instructor-Executor Paradigm

指导者–执行者范式

  • Education 教育
  • Health 健康
  • Other Application 其他应用
2.3.2 Equal Partnership Paradigm

平等伙伴范式

  • Empathetic Communicator 富有同理心的交流者
  • Human-Level Participant 拥有类人水平的参与者

3️⃣ Agent Society: From Individuality to Sociality

智能体社会:从个体到社会

🧩 探讨“当智能体群体互动时,是否会自发形成社会结构”。


3.1 Behavior and Personality of LLM-based Agents

LLM智能体的行为与人格

  • 3.1.1 Social Behavior 社会行为

    • Individual behaviors 个体行为
    • Group behaviors 群体行为
  • 3.1.2 Personality 人格特质

    • Cognition 认知
    • Emotion 情感
    • Character 性格

3.2 Environment for Agent Society

智能体社会的环境

  • 3.2.1 Text-based Environment 基于文本的环境
  • 3.2.2 Virtual Sandbox Environment 虚拟沙盒环境
  • 3.2.3 Physical Environment 物理环境

3.3 Society Simulation with LLM-based Agents

基于LLM智能体的社会模拟

💬 例如:AI小镇、AI社交实验、群体舆情演化模拟。


4️⃣ Other Topics

其他主题

4.1 Benchmarks for LLM-based Agents

LLM智能体的评测基准

4.2 Training and Optimizing LLM-based Agents

LLM智能体的训练与优化


📚 Citation

参考文献

👥 Project Maintainers & Contributors

项目维护者与贡献者

📩 Contact

联系方式

⭐ Star History

项目Star历史


📊 内容结构总览图(逻辑层级)

LLM-based Agent Survey
1. Construction
Brain
Knowledge & Memory
Reasoning & Planning
Perception
Action
2. Applications
Single-Agent
Multi-Agent
Human-Agent Collaboration
3. Agent Society
Behavior & Personality
Environment
Social Simulation
4. Benchmarks & Training

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐