LLM - A2A 多 Agent 协作与 Memory

本文探讨了多Agent协作（A2A）系统的设计重点与挑战。随着任务复杂度提升，单一"超级Agent"面临瓶颈，Google提出通过专业Agent分工协作来分解系统复杂度。文章分析了角色分工、流水线和专家团队三种协作模式，并指出多Agent系统需解决调度死锁、可观测性和权限控制等工程挑战。在Memory设计方面，强调区分短期/长期记忆层级，设计私有/共享记忆空间，并通过A2A协议

小小工匠

615人浏览 · 2025-12-08 05:00:00

小小工匠 · 2025-12-08 05:00:00 发布

文章目录

在这里插入图片描述

Pre

LLM - Google 5-Day AI Agents Intensive

多 Agent 协作：A2A 时代的系统设计重点

为什么需要多 Agent，而不是一个「超级 Agent」

随着任务复杂度提升，试图用一个「万能 Agent」解决所有问题会遇到明显瓶颈：指令越来越长、Prompt 越来越复杂、上下文越来越难以维护，最终既难以调试，又难以控制行为边界。这与传统软件工程中「单体应用」的问题类似：复杂度集中在一个巨无霸里，任何修改都会牵一发动全身。

Google 在 5-Day AI Agents Intensive 的后半程，将「多 Agent 协作（A2A）」作为重点内容之一，目的就是引导开发者用「面向协作」的视角拆解系统：把任务拆成多个专业 Agent，通过协议协同完成，而不是让一个 Agent 负责所有环节。这种方式可以在保持总体智能能力的同时，把复杂度拆散到多个职责更清晰的 Agent 上。[5][1]

常见协作模式与 A2A 协议思路

结合 Google 课程和行业实践，可以归纳出几类常见的多 Agent 协作模式：

角色分工模式
- 例：
  - 研究员 Agent：负责信息检索、数据分析和事实核查。
  - 写作 Agent：负责结构化表达与内容生成。
  - 审稿 Agent：负责逻辑审查、事实一致性与风格统一。
- 协作方式：通过 A2A 协议或类似消息总线传递「任务」「中间结果」「审稿意见」。
Pipeline 模式（流水线）
- 任务沿固定流程流转：输入 → 解析 → 规划 → 执行 → 审核 → 汇总。
- 每一环可以由不同 Agent 承担，类似于「自动化生产线」，适合规则较稳定的业务流程。
专家团队模式
- 针对复杂问题（如法律 + 财务 + 技术综合决策），构建不同领域的专家 Agent，由一个协调 Agent 根据任务内容路由到合适的专家。
- 需要清晰的「议题划分」「冲突解决」和「最终裁决」机制。

Google 在 Vertex AI Agent Engine 中提出的 A2A（Agent-to-Agent）能力，本质上是提供一套标准化通信机制，让 Agent 可以在云端安全地发送/接收消息、共享状态并按照约定的协议协作，而无需每个团队自己造轮子设计通信格式。

多 Agent 协作中的工程挑战

多 Agent 带来的挑战不容忽视，否则系统会演变为「混乱对话群聊」而不是「有序协作团队」：

调度与死锁问题
- 若没有全局调度策略，不同 Agent 可能互相等待或循环请求，形成「对话死锁」。
- 需要在架构层面限定交互拓扑（谁可以给谁发消息、由谁做最后决策）以及设置超时和中止规则。
可观测性与可调试性
- 单 Agent 系统尚可通过简单日志排查问题，多 Agent 系统必须具备：
  - 跨 Agent 的调用链跟踪（Tracing）。
  - 对单次任务执行进行「回放（Replay）」的能力，用于复现问题场景。[4][5]
权限与安全边界
- 不同 Agent 对工具和数据的访问权限应不同，例如「审稿 Agent」不应拥有删除数据库记录的权限。
- 需要在 A2A 层之上再叠一层「访问控制策略」，避免权限扩散。

Google 在课程中强调，多 Agent 建设要从小规模实验开始，通过 A/B 测试和严格监控逐步扩大使用范围，而不是一开始就建设庞大的「全能 Agent 团队」系统。

Memory 设计：支撑多 Agent 的「集体长期记忆」

Memory 不等于「把对话全塞进上下文」

在早期 LLM 应用中，开发者经常把「多轮对话」与「记忆」混为一谈，简单地将所有历史消息塞进上下文，希望模型「自动记住」。但随任务复杂度和调用频次提升，这种方式很快会遇到成本和效果的双重瓶颈。

Google 在 5-Day AI Agents Intensive 中，将「Memory Management」单独作为一天的核心内容，强调记忆系统要「设计」而不是「堆砌」。其基本原则包括：

区分不同层次的记忆：
- 短期记忆：当前任务或会话的状态。
- 中期记忆：一个项目或任务链的上下文。
- 长期记忆：稳定偏好、长期知识和过去重要事件。
控制写入策略：不是所有信息都写入长期记忆，而是经过「重要性」「长期价值」筛选。
支持按需读取：Agent 需要在规划时决定是否主动检索记忆，而不是被动等待系统「自动加载全部历史」。

在实际工程中，这意味着开发者需要为记忆做 schema 设计、索引设计和生命周期管理，而不仅仅是使用一个向量库。

单 Agent 内部记忆：Session 与长期偏好

以单 Agent 为单位，Memory 设计可以分为两块：

Session State（会话/任务级状态）
- 包含当前任务目标、已完成步骤、尚未完成的子任务、最近的工具调用轨迹等。
- 通常以结构化对象 + 部分摘要形式存储，避免每轮都传完整历史。
Long-Term Memory（长期偏好与知识）
- 用户偏好：常用工具、语言风格、隐含约束（如预算范围、风险偏好）。
- 关键事件：历史任务的总结、重要决策的理由。
- 领域知识：可供多次复用的知识片段或经验规则。

Google 课程中的一个思路是：在 Agent 执行流程里显式增加「Write Memory」和「Read Memory」步骤，让模型在合适的时间主动决定是否把当前结果写入长期记忆、是否去记忆系统检索相关历史，而不是通过外层业务逻辑硬编码所有读写操作。

多 Agent 视角下的 Memory：共享还是隔离？

当系统从单 Agent 扩展到多 Agent 时，Memory 设计会迎来额外的复杂度：哪些记忆是每个 Agent 私有的，哪些可以共享？共享到什么粒度？如何防止信息泄露或不必要的「信息污染」？

可以参考以下几种策略：

私有记忆（Per-Agent Memory）
- 每个 Agent 拥有自己的长期记忆，存放与其角色相关的经验和偏好。
- 例如，「研究员 Agent」记录过去检索策略的成功经验，「审稿 Agent」记录质量问题模式。
- 优点：隔离干扰，减少不同 Agent 在记忆上的「噪声」互相影响。
共享记忆空间（Shared Workspace）
- 类似「多 Agent 的白板」，存放当前任务相关的关键中间结果、决策摘要和结论。
- 所有参与任务的 Agent 都可以读取这一空间，但写入通常需要规范和权限控制。
元记忆（Meta-Memory）
- 用于记录「整个系统的运行经验」，例如某类任务由哪种 Agent 组合效果最好、哪些工具容易出错等。
- 更像是面向系统维护者和协调 Agent 的洞察数据库，用于自动调优调度策略。

在 Google 的 Agent Engine + A2A 设想中，可以通过统一的存储与访问层，把「私有记忆」「共享记忆」「元记忆」用不同命名空间或权限策略区分开来，让各 Agent 既能充分利用群体经验，又不会造成权限与数据安全问题。

Memory 与 A2A 的交互模式

在多 Agent 系统中，Memory 与 A2A 协作紧密耦合，典型的交互方式包括：[5][6][4]

协作白板模式
- 多个 Agent 通过 A2A 协议向同一个共享记忆空间写入自己的中间结果和结论。
- 协调 Agent 再从这个空间读取所有信息，做最终汇总和决策。
问答式记忆查询
- 某个 Agent 在执行过程中，通过 A2A 向「记忆管理 Agent」发送查询请求，让其负责从长期记忆中检索相关信息并返回摘要。
- 好处是将复杂的记忆检索与整理逻辑集中于专职 Agent，其他 Agent 保持轻量。
经验反馈与学习
- 在任务结束后，评估 Agent 对整个多 Agent 流程进行复盘，将「成功模式」和「失败教训」写入元记忆，使未来任务在调度和策略选择上自动变得更优。

这类设计使得 Memory 不再只是「聊天记录」，而成为多 Agent 系统持续演化和改进的基础设施层。

小结式承接：如何把 A2A 与 Memory 落到实战

落地建议，大致可以归纳为：

在架构层面优先考虑：是否需要多个职责明确的 Agent，而不是从一开始就做「万能 Agent」。
在系统层明确 A2A 协作模式：角色分工、消息拓扑、调度策略和终止条件。
把 Memory 视为第一等公民：设计好短期/中期/长期记忆以及私有/共享/元记忆的边界与访问模式。
构建可观测、可调试、可演化的 Agent 系统，而不是把逻辑全部塞进单次模型调用里。

参考资料

DESIAI – 5-Day GenAI Intensive 深度解析
https://www.desiai.ai/googles-5-day-gen-ai-intensive-course-november-2025-all-you-need-to-know/

Versatile Scientist – Google × Kaggle 5-Day AI Agents Intensive 实作心得
https://www.versatilescientist.com/5-day-ai-agents-intensive-by-google-kaggle/

IBM – 2025 年 AI Agents：预期 vs 现实
https://www.ibm.com/think/insights/ai-agents-2025-expectations-vs-reality

McKinsey – 把握 Agentic AI 的商业优势
https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage

LinkedIn – 参与者（Rishindra Mateti）分享 Google-Kaggle 5-Day AI Agents Intensive 体验
https://www.linkedin.com/posts/rishindra-mateti-tech_google-kaggle-5-day-ai-agents-intensive-activity-7394974843223404544-2Za8

Market.us – Agentic AI 市场报告
https://market.us/report/agentic-ai-market/

CodeWave – Agentic AI 趋势与预测分析
https://codewave.com/insights/agentic-ai-trends-predictions/

YouTube – AI Agents Intensive 课程讲解（Playlist 第 3 项）
https://www.youtube.com/watch?v=g6MVIEzFTjY&list=PLqFaTIg4myu-lbBTrUpoQQIzZZxvrOaP5&index=3&themeRefresh=1

在这里插入图片描述