LLM - A2A 多 Agent 协作 与 Memory
本文探讨了多Agent协作(A2A)系统的设计重点与挑战。随着任务复杂度提升,单一"超级Agent"面临瓶颈,Google提出通过专业Agent分工协作来分解系统复杂度。文章分析了角色分工、流水线和专家团队三种协作模式,并指出多Agent系统需解决调度死锁、可观测性和权限控制等工程挑战。在Memory设计方面,强调区分短期/长期记忆层级,设计私有/共享记忆空间,并通过A2A协议
文章目录

Pre
LLM - Google 5-Day AI Agents Intensive
多 Agent 协作:A2A 时代的系统设计重点
为什么需要多 Agent,而不是一个「超级 Agent」
随着任务复杂度提升,试图用一个「万能 Agent」解决所有问题会遇到明显瓶颈:指令越来越长、Prompt 越来越复杂、上下文越来越难以维护,最终既难以调试,又难以控制行为边界。 这与传统软件工程中「单体应用」的问题类似:复杂度集中在一个巨无霸里,任何修改都会牵一发动全身。
Google 在 5-Day AI Agents Intensive 的后半程,将「多 Agent 协作(A2A)」作为重点内容之一,目的就是引导开发者用「面向协作」的视角拆解系统:把任务拆成多个专业 Agent,通过协议协同完成,而不是让一个 Agent 负责所有环节。 这种方式可以在保持总体智能能力的同时,把复杂度拆散到多个职责更清晰的 Agent 上。[5][1]
常见协作模式与 A2A 协议思路
结合 Google 课程和行业实践,可以归纳出几类常见的多 Agent 协作模式:
-
角色分工模式
- 例:
- 研究员 Agent:负责信息检索、数据分析和事实核查。
- 写作 Agent:负责结构化表达与内容生成。
- 审稿 Agent:负责逻辑审查、事实一致性与风格统一。
- 协作方式:通过 A2A 协议或类似消息总线传递「任务」「中间结果」「审稿意见」。
- 例:
-
Pipeline 模式(流水线)
- 任务沿固定流程流转:输入 → 解析 → 规划 → 执行 → 审核 → 汇总。
- 每一环可以由不同 Agent 承担,类似于「自动化生产线」,适合规则较稳定的业务流程。
-
专家团队模式
- 针对复杂问题(如法律 + 财务 + 技术综合决策),构建不同领域的专家 Agent,由一个协调 Agent 根据任务内容路由到合适的专家。
- 需要清晰的「议题划分」「冲突解决」和「最终裁决」机制。
Google 在 Vertex AI Agent Engine 中提出的 A2A(Agent-to-Agent)能力,本质上是提供一套标准化通信机制,让 Agent 可以在云端安全地发送/接收消息、共享状态并按照约定的协议协作,而无需每个团队自己造轮子设计通信格式。
多 Agent 协作中的工程挑战
多 Agent 带来的挑战不容忽视,否则系统会演变为「混乱对话群聊」而不是「有序协作团队」:
-
调度与死锁问题
- 若没有全局调度策略,不同 Agent 可能互相等待或循环请求,形成「对话死锁」。
- 需要在架构层面限定交互拓扑(谁可以给谁发消息、由谁做最后决策)以及设置超时和中止规则。
-
可观测性与可调试性
- 单 Agent 系统尚可通过简单日志排查问题,多 Agent 系统必须具备:
- 跨 Agent 的调用链跟踪(Tracing)。
- 对单次任务执行进行「回放(Replay)」的能力,用于复现问题场景。[4][5]
- 单 Agent 系统尚可通过简单日志排查问题,多 Agent 系统必须具备:
-
权限与安全边界
- 不同 Agent 对工具和数据的访问权限应不同,例如「审稿 Agent」不应拥有删除数据库记录的权限。
- 需要在 A2A 层之上再叠一层「访问控制策略」,避免权限扩散。
Google 在课程中强调,多 Agent 建设要从小规模实验开始,通过 A/B 测试和严格监控逐步扩大使用范围,而不是一开始就建设庞大的「全能 Agent 团队」系统。
Memory 设计:支撑多 Agent 的「集体长期记忆」
Memory 不等于「把对话全塞进上下文」
在早期 LLM 应用中,开发者经常把「多轮对话」与「记忆」混为一谈,简单地将所有历史消息塞进上下文,希望模型「自动记住」。但随任务复杂度和调用频次提升,这种方式很快会遇到成本和效果的双重瓶颈。
Google 在 5-Day AI Agents Intensive 中,将「Memory Management」单独作为一天的核心内容,强调记忆系统要「设计」而不是「堆砌」。其基本原则包括:
- 区分不同层次的记忆:
- 短期记忆:当前任务或会话的状态。
- 中期记忆:一个项目或任务链的上下文。
- 长期记忆:稳定偏好、长期知识和过去重要事件。
- 控制写入策略:不是所有信息都写入长期记忆,而是经过「重要性」「长期价值」筛选。
- 支持按需读取:Agent 需要在规划时决定是否主动检索记忆,而不是被动等待系统「自动加载全部历史」。
在实际工程中,这意味着开发者需要为记忆做 schema 设计、索引设计和生命周期管理,而不仅仅是使用一个向量库。
单 Agent 内部记忆:Session 与长期偏好
以单 Agent 为单位,Memory 设计可以分为两块:
-
Session State(会话/任务级状态)
- 包含当前任务目标、已完成步骤、尚未完成的子任务、最近的工具调用轨迹等。
- 通常以结构化对象 + 部分摘要形式存储,避免每轮都传完整历史。
-
Long-Term Memory(长期偏好与知识)
- 用户偏好:常用工具、语言风格、隐含约束(如预算范围、风险偏好)。
- 关键事件:历史任务的总结、重要决策的理由。
- 领域知识:可供多次复用的知识片段或经验规则。
Google 课程中的一个思路是:在 Agent 执行流程里显式增加「Write Memory」和「Read Memory」步骤,让模型在合适的时间主动决定是否把当前结果写入长期记忆、是否去记忆系统检索相关历史,而不是通过外层业务逻辑硬编码所有读写操作。
多 Agent 视角下的 Memory:共享还是隔离?
当系统从单 Agent 扩展到多 Agent 时,Memory 设计会迎来额外的复杂度:哪些记忆是每个 Agent 私有的,哪些可以共享?共享到什么粒度?如何防止信息泄露或不必要的「信息污染」?
可以参考以下几种策略:
-
私有记忆(Per-Agent Memory)
- 每个 Agent 拥有自己的长期记忆,存放与其角色相关的经验和偏好。
- 例如,「研究员 Agent」记录过去检索策略的成功经验,「审稿 Agent」记录质量问题模式。
- 优点:隔离干扰,减少不同 Agent 在记忆上的「噪声」互相影响。
-
共享记忆空间(Shared Workspace)
- 类似「多 Agent 的白板」,存放当前任务相关的关键中间结果、决策摘要和结论。
- 所有参与任务的 Agent 都可以读取这一空间,但写入通常需要规范和权限控制。
-
元记忆(Meta-Memory)
- 用于记录「整个系统的运行经验」,例如某类任务由哪种 Agent 组合效果最好、哪些工具容易出错等。
- 更像是面向系统维护者和协调 Agent 的洞察数据库,用于自动调优调度策略。
在 Google 的 Agent Engine + A2A 设想中,可以通过统一的存储与访问层,把「私有记忆」「共享记忆」「元记忆」用不同命名空间或权限策略区分开来,让各 Agent 既能充分利用群体经验,又不会造成权限与数据安全问题。
Memory 与 A2A 的交互模式
在多 Agent 系统中,Memory 与 A2A 协作紧密耦合,典型的交互方式包括:[5][6][4]
-
协作白板模式
- 多个 Agent 通过 A2A 协议向同一个共享记忆空间写入自己的中间结果和结论。
- 协调 Agent 再从这个空间读取所有信息,做最终汇总和决策。
-
问答式记忆查询
- 某个 Agent 在执行过程中,通过 A2A 向「记忆管理 Agent」发送查询请求,让其负责从长期记忆中检索相关信息并返回摘要。
- 好处是将复杂的记忆检索与整理逻辑集中于专职 Agent,其他 Agent 保持轻量。
-
经验反馈与学习
- 在任务结束后,评估 Agent 对整个多 Agent 流程进行复盘,将「成功模式」和「失败教训」写入元记忆,使未来任务在调度和策略选择上自动变得更优。
这类设计使得 Memory 不再只是「聊天记录」,而成为多 Agent 系统持续演化和改进的基础设施层。
小结式承接:如何把 A2A 与 Memory 落到实战
落地建议,大致可以归纳为:
- 在架构层面优先考虑:是否需要多个职责明确的 Agent,而不是从一开始就做「万能 Agent」。
- 在系统层明确 A2A 协作模式:角色分工、消息拓扑、调度策略和终止条件。
- 把 Memory 视为第一等公民:设计好短期/中期/长期记忆以及私有/共享/元记忆的边界与访问模式。
- 构建可观测、可调试、可演化的 Agent 系统,而不是把逻辑全部塞进单次模型调用里。
参考资料
DESIAI – 5-Day GenAI Intensive 深度解析
https://www.desiai.ai/googles-5-day-gen-ai-intensive-course-november-2025-all-you-need-to-know/
Versatile Scientist – Google × Kaggle 5-Day AI Agents Intensive 实作心得
https://www.versatilescientist.com/5-day-ai-agents-intensive-by-google-kaggle/
IBM – 2025 年 AI Agents:预期 vs 现实
https://www.ibm.com/think/insights/ai-agents-2025-expectations-vs-reality
McKinsey – 把握 Agentic AI 的商业优势
https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage
LinkedIn – 参与者(Rishindra Mateti)分享 Google-Kaggle 5-Day AI Agents Intensive 体验
https://www.linkedin.com/posts/rishindra-mateti-tech_google-kaggle-5-day-ai-agents-intensive-activity-7394974843223404544-2Za8
Market.us – Agentic AI 市场报告
https://market.us/report/agentic-ai-market/
CodeWave – Agentic AI 趋势与预测分析
https://codewave.com/insights/agentic-ai-trends-predictions/
YouTube – AI Agents Intensive 课程讲解(Playlist 第 3 项)
https://www.youtube.com/watch?v=g6MVIEzFTjY&list=PLqFaTIg4myu-lbBTrUpoQQIzZZxvrOaP5&index=3&themeRefresh=1

更多推荐



所有评论(0)