构建高效Agentic系统(Anthropic文章译文简化版)

摘要：本文分享了大语言模型（LLM）智能体（Agent）的构建经验，强调简单可组合的范式往往比复杂框架更有效。文章区分了工作流（Workflow）与自主体（Agent），前者适用于步骤固定的任务，后者用于需动态决策的场景。建议优先尝试单轮LLM调用，仅在必要时引入多步骤流程，并警惕框架带来的调试难度。核心模式包括提示链、路由、并行化、主从协调、评估优化，可灵活组合。代理适用于开放式任务，但需注意

青w韵

20人浏览 · 2025-09-01 20:44:23

青w韵 · 2025-09-01 20:44:23 发布

构建高效代理

2024 年 12 月 19 日发布

过去一年多，我们与金融、医疗、法律、软件等行业的数十支团队合作，基于大语言模型（LLM）构建「Agent」。

最令我们惊讶的结论是：
最成功的落地往往不是用了复杂框架或专用库，而是用了简单、可组合的范式。

本文把我们从客户实践和自身研发中总结的经验整理成一份实用指南，供开发者参考。

什么是智能体“Agent”？

业界对 “Agent” 的定义并不统一：
• 有人认为它是全自主系统，长期独立运行，调用多种工具完成复杂任务；
• 有人把它当作遵循预设流程的脚本化实现。

在 Anthropic，我们把上述所有形态统称为 Agentic System （智能体系统），但会在架构上区分 Workflow（工作流） 与 Agent（自主体） ：

类型	控制方式	适用场景
Workflow	代码预先编排 LLM 与工具的调用路径	任务步骤可枚举、结果可预期
Agent	LLM 自主决定每一步骤与工具的使用	任务步骤不可枚举，需要动态决策

下文会逐一展开。附录 1 给出了两个行业落地示例。

什么时候该用（或不该用）Agent？

能不用就不用。
先用最简单的 LLM 调用（可配合检索、示例）把效果做到可用；只有当单轮调用无法满足需求时，再逐步引入多步骤的 Workflow 或 Agent。
Agent 会带来延迟与成本上升，务必确认「性能提升 > 成本增加」。

需求特征	推荐方案
任务步骤固定、结果可预期	Workflow
步骤无法预先枚举，需要模型自主决策	Agent
单轮 LLM + 检索即可满足	直接调用 LLM API

何时、如何使用框架？

常见框架：LangGraph、Amazon Bedrock Agent、Rivet、Vellum 等。
它们把「调 LLM、定义工具、链式调用」封装成了低代码/无代码组件，上手快；但也带来两个问题：

抽象层让 prompt/response 难以调试；
容易「为了框架而框架」，引入不必要的复杂度。

建议：
• 先用 LLM API 裸写，验证思路；
• 真要上框架，一定读源码，弄清底层到底干了什么。
我们的 cookbook 里给出了不少「十几行代码即可实现」的示例。

构建模块、工作流和代理

在这一部分，我们将探讨我们在生产中看到的智能体系统的常见模式。我们将从基础构建块——增强型 LLM 开始，逐步增加复杂性，从简单的组合工作流到自主智能体。

构建模块：增强型 LLM

LLM 调用里统一提供检索、工具调用、记忆三项增强能力。模型能够主动使用这些功能生成自己的搜索查询、选择合适的工具，并确定要保留哪些信息。

在这里插入图片描述

实际使用时，关注两个关键方面：

根据具体用例定制功能(Tool)，并确保它们为 LLM 提供简单、文档完善的接口。
虽然实现增强功能的方法有很多，但一种方法是通过我们最近发布的模型上下文协议Model Context protocol，该协议允许开发人员通过简单的客户端实现与不断增长的三方工具生态系统集成。

在本帖的其余部分，我们将假设每次 LLM 调用都可以访问这些增强功能。

Workflow 1：提示链（Prompt Chaining）

把任务拆成一串步骤，每一步 LLM 拿到上一步的结果继续加工，可在中间部分插入代码校验分支(Gate)

在这里插入图片描述

何时使用此工作流：任务天然可拆，且子任务顺序固定。主要目标是通过将每个 LLM 调用作为一个更简单的任务，牺牲部分延迟以换取更高的准确性。

提示链有用的例子：

生成营销文案，然后将其翻译成另一种语言。
撰写文档提纲，检查提纲是否符合特定标准，然后根据提纲撰写文档。

Workflow 2：路由（Routing）

对输入做分类，路由到专门的后续流程。这种工作流程允许关注点的分离，并构建更专业的提示。没有这种工作流程，针对一种输入的优化可能会损害其他输入的性能。

在这里插入图片描述

何时使用此工作流：路由适用于复杂任务，其中存在不同的类别，这些类别更适合分别处理，并且分类可以由 LLM 或更传统的分类模型/算法准确处理。

路由有用的示例：

客服机器人把「退款」「技术支持」「一般咨询」引导至不同的子流程、提示和工具。
将简单/常见问题路由至 Claude 3.5 Haiku 等较小模型，将困难/不常见问题路由至 Claude 3.5 Sonnet 等更强大的模型，以优化成本和速度。

Workflow 3：并行化（Parallelization）

LLMs 有时可以同时处理一个任务，并且可以程序性地聚合它们的输出。这种工作流，即并行化，表现为两种关键变体：

• Sectioning（分段）：把任务横向切成独立子任务并发跑；
• Voting（投票）：同一任务多跑几遍，投票或择优。

在这里插入图片描述

何时使用此工作流程：子任务可并行加速，或需要多个视角结果。
对于具有多个考量/考察点的复杂任务，当每个考量都由单独的 LLM 调用处理时，LLMs 通常表现更好，这允许专注于每个特定方面。

并行化有用的例子：

```
分段：
```
- 实现护栏(guardrails)，其中一个模型实例处理用户查询，而另一个模型筛选不适当的内容或请求。这通常比让同一个 LLM 调用处理护栏和核心响应表现得更好。
- 自动化评估 LLM 性能的评估，其中每个 LLM 调用评估模型在给定提示下性能的不同方面。
```
投票：
```
- 审查一段代码以查找漏洞，其中 多个不同的提示 会检查代码并在发现问题时进行标记。
- 评估某项内容是否不当，通过多个提示来评估不同方面或要求不同的投票阈值以平衡假阳性和假阴性。