【大模型应用】多 Agent 系统详解【概念、组件、流程、示例】

摘要：多Agent系统（MAS）是由多个智能Agent组成的协作网络，通过分工协同解决复杂问题。相比单一模型，MAS具备专业化（各Agent专注特定任务）、可靠性（内置纠错机制）、可扩展性（灵活添加新Agent）等优势。典型架构包含角色明确的Agent、协调任务的Orchestrator、通信机制（消息传递/共享空间）及工具库。工作流程示例显示，MAS能像专业团队般分解任务（如需求分析→编码→测试

.Shu.

1549人浏览 · 2025-09-19 14:00:04

.Shu. · 2025-09-19 14:00:04 发布

第一部分：核心理念 —— 什么是多Agent系统？

1. 核心定义

多Agent系统 是由多个智能Agent 组成的集合。这些Agent在一个共享的环境中，通过感知、决策、通信和协作，共同完成一个或多个复杂的、超出单个Agent能力范围的任务。

你可以将其理解为：

一个高度专业化的“AI团队”或“数字公司”：就像一个有CEO、CTO、CFO、项目经理、设计师和工程师的团队，每个成员（Agent）各司其职，协同工作，共同完成一个大型项目。
模块化的AI工作流：将复杂的AI任务分解成多个子任务，并由最擅长该子任务的专门化Agent来处理。
“分而治之”思想的AI实践：通过分工、协作和监督，解决单一庞大模型（如一个LLM）可能面临的可靠性、深度和复杂度问题。

2. 为什么需要多Agent架构？（与单一Prompt或单一Agent的区别）

特性	单一Prompt/Agent	多Agent系统
能力范围	通用，但广而不精	深度专业化，每个Agent可专注于特定领域
任务复杂度	适合相对简单、线性的任务	适合极其复杂、需要多步骤推理和协作的任务
可靠性	一步出错，全盘皆输。存在幻觉或错误累积。	具备内在的纠错机制。一个Agent的错误可以被其他Agent（如评审Agent）发现和纠正。
可扩展性	难以扩展，依赖于单个模型的能力上限	易于扩展，通过增加新的专业Agent即可增强系统能力
成本与效率	可能因一个复杂Prompt而产生高昂的token成本	可以将任务分配给更小、更便宜的模型，总体成本可能更优

第二部分：多Agent系统的核心组件详解

一个典型的多Agent工程架构由以下核心组件构成：

1. Agent（智能体）

这是系统的基本单位。每个Agent通常包含以下几个部分：

身份/角色：明确定义Agent的专长和职责（如“Python程序员”、“代码评审员”、“产品经理”）。
核心能力：通常是一个大语言模型，也可以是专门训练的模型、工具或API。
目标：该Agent要完成的具体子任务。
工作记忆：Agent在单次会话或任务中记住的上下文信息。

示例：在一个软件开发团队中，可以有：

ArchitectAgent：负责设计系统架构。
CoderAgent：负责编写代码。
TesterAgent：负责编写测试用例。
ReviewerAgent：负责代码审查。

2. 协调者/控制器（Orchestrator/Controller）

这是整个系统的大脑，负责任务调度和Agent协同。它的主要职责包括：

任务分解：接收用户初始请求，并将其分解为一系列子任务。
工作流管理：决定任务执行的顺序和逻辑（顺序、并行、条件分支）。
Agent调度：根据子任务的要求，选择最合适的Agent来执行。
状态管理：跟踪每个子任务的完成状态和整个项目的进度。

3. 通信机制（Communication Mechanism）

Agent之间如何“交谈”是架构的关键。主要有两种模式：

基于消息的通信：这是最主流的方式。Agent之间通过发送和接收结构化的消息（如JSON格式）进行交互。消息内容通常包括：
- sender: 发送者
- recipient: 接收者
- content: 消息内容（指令、数据、结果等）
- type: 消息类型（如 task_request, result_submission, review_feedback）
共享工作空间/黑板模型：所有Agent都可以读写一个共享的存储区域（如数据库、内存数据结构）。Agent将结果写入共享区，其他Agent从中读取所需信息。这种方式更适用于数据流密集的应用。

4. 工具与知识库（Tools & Knowledge Base）

Agent并非无所不知，它们需要外部工具的增强。

工具：Agent可以调用的函数或API，如：
- 代码执行环境（执行生成的代码）
- 网络搜索API（获取实时信息）
- 文件读写（管理项目文件）
- 计算器、数据库查询等。
知识库：存储专有数据、项目上下文、历史记录等，供Agent检索使用，确保回答基于事实。

第三部分：多Agent系统的工作流程（以软件开发为例）

让我们通过一个经典的“自动生成一个网页应用”的任务，来可视化整个工作流程。

用户输入：“请创建一个简单的待办事项（Todo List）网页应用，使用HTML/CSS/JS，并包含添加和删除项目的功能。”

任务接收与分解：
- Orchestrator 收到用户请求。
- Orchestrator 分析后，将任务分解为：[需求分析, 技术设计, 前端编码, 测试用例编写, 代码审查, 集成部署]。
Agent调度与执行：
- Orchestrator 首先唤醒 ProductManagerAgent。
  - ProductManagerAgent 生成更详细的需求文档（用户故事、功能点），并发送给Orchestrator。
- Orchestrator 将需求文档发送给 ArchitectAgent。
  - ArchitectAgent 设计技术方案（文件结构、技术栈），并发送给Orchestrator。
- Orchestrator 将需求和设计发送给 FrontendCoderAgent。
  - FrontendCoderAgent 开始编写 index.html, style.css, script.js。它可能会调用代码执行工具来测试一段代码是否有效。
- 同时，Orchestrator 将需求发送给 QAAgent。
  - QAAgent 根据需求编写自动化测试用例（如使用Jest或Selenium的脚本）。
- Orchestrator 将编写好的代码和测试用例发送给 CodeReviewerAgent。
  - CodeReviewerAgent 检查代码质量、是否符合设计、有无安全漏洞，并生成评审意见。
  - 如果评审不通过，意见将被发回给 FrontendCoderAgent 进行修改。此循环可能持续多次。
结果集成与交付：
- 一旦所有子任务都完成且评审通过，Orchestrator 会唤醒 DeploymentAgent。
- DeploymentAgent 将所有文件打包，可能调用Git工具提交代码，或调用服务器部署工具将应用部署到云端。
- Orchestrator 最终向用户返回一个链接：“您的要求事项应用已开发并部署完成，请访问：http://…”

第四部分：实现框架与示例

目前，已有多个优秀的框架可以简化多Agent系统的开发：

AutoGen (Microsoft)：目前最流行的框架之一。它核心概念是 ConversableAgent，通过代理之间的对话来协作。支持自定义代理行为、工具调用、人类参与等。
CrewAI：一个新兴的框架，概念非常直观，明确引入了 Agent, Task, Process（流程：顺序/并行）和 Crew 的概念，非常符合人类管理项目的直觉。
LangGraph / LangChain： LangChain的扩展，用图（Graph）的概念来显式地定义和控制Agent的工作流，非常适合复杂、有状态的多步骤应用。

CrewAI 代码示例

以下是一个使用CrewAI框架实现“研究一个主题并撰写报告”的简化示例：

import os
from crewai import Agent, Task, Crew, Process
from langchain_openai import ChatOpenAI

# 设置LLM，例如使用GPT-4
os.environ["OPENAI_API_KEY"] = "your_api_key"
llm = ChatOpenAI(model="gpt-4-turbo")

# 第一步：定义Agent（招聘团队成员）
researcher = Agent(
  role='资深研究员',
  goal='针对指定主题进行深入、准确的研究',
  backstory='一位善于从网络获取准确信息的专家',
  tools=[tool1, tool2], # 例如，可以接入Bing搜索工具
  verbose=True,
  llm=llm
)

writer = Agent(
  role='技术作家',
  goal='根据研究资料撰写清晰、流畅、结构严谨的报告',
  backstory='一位擅长将复杂信息转化为易读内容的技术作家',
  verbose=True,
  llm=llm
)

# 第二步：定义Task（规划工作任务）
research_task = Task(
  description='研究“2024年人工智能在多Agent系统方面的最新进展”。',
  expected_output='一份包含关键发现、趋势和重要引用的详细研究摘要。',
  agent=researcher  # 将这个任务分配给研究员
)

write_task = Task(
  description='根据研究员提供的信息，撰写一篇关于“2024年AI多Agent系统进展”的博客文章。',
  expected_output='一篇约1000词、结构清晰（引言、正文、结论）、引人入胜的博客文章。',
  agent=writer  # 将这个任务分配给作家
)

# 第三步：组建Crew（组建团队并制定工作流程）
crew = Crew(
  agents=[researcher, writer],
  tasks=[research_task, write_task],
  process=Process.sequential  # 明确工作流程：顺序执行（先研究，再写作）
)

# 第四步：启动Crew（让团队开始工作！）
result = crew.kickoff()
print(result)