别再盲目堆 Agent 了！Anthropic 官方教你从简单做起

在 AI 应用开发领域，奥卡姆剃刀原则依然是最高指导思想。解决问题的关键，不在于你的系统有多复杂，而在于你是否构建了恰到好处的系统。保持简洁：能简单就别复杂确保透明：让 Agent 的规划步骤清晰可见打磨接口：工具文档写清楚，测试做充分从简单的 Prompt 开始。只有当简单方案无法满足需求时，再考虑引入多步骤的 Agentic 系统。别为了 Agent 而 Agent。原文链接。

SYTnIU

2396人浏览 · 2026-01-10 00:00:00

SYTnIU · 2026-01-10 00:00:00 发布

原文链接 别再盲目堆 Agent 了！Anthropic 官方教你从简单做起

Anthropic 官方教程：别急着上 Agent，先把 Workflow 玩明白

最近，AI 圈有一个词被严重"通货膨胀"了——Agent。

打开任何一个 AI 产品的官网，不管是做客服的、写代码的、还是搞自动化的，清一色都在喊"我们是 Agent"。仿佛不贴上这个标签，就跟不上时代一样。

但说实话，很多所谓的"Agent"，本质上就是几个 API 调用串在一起，离真正的自主智能体还差十万八千里。

就在这个人人都在炒作 Agent 的当口，Anthropic（Claude 的母公司）发了一篇工程博客：《Building Effective Agents》。

这篇文章的核心观点，用一句话概括就是：

能用简单方案解决的问题，就别上复杂系统。

听起来像废话？但当你看到多少团队在为了"看起来酷"而堆砌复杂架构时，就会明白这句话有多珍贵。

今天，我就来拆解一下这篇文章的核心内容。

一、先搞清楚：Agent 和 Workflow 到底有什么区别？

在开始之前，我们得先把两个核心概念掰扯清楚：

Workflow（工作流）：你提前编排好了 LLM 和工具的调用顺序，程序按既定路线走。你是导演，AI 是演员。
Agent（智能体）：LLM 自己决定调用什么工具、按什么顺序执行。AI 既是演员，也是导演。

一个是"按剧本演"，一个是"即兴发挥"。

那什么时候该用哪个呢？

Anthropic 给出了一个非常务实的判断标准：

场景	推荐方案
任务流程确定，追求可预测性和一致性	Workflow
任务流程不确定，需要灵活决策	Agent
大多数日常任务	先别急，优化好单个 LLM 调用就够了

没错，很多时候你根本不需要 Agent，甚至不需要 Workflow——通过检索增强（RAG）和上下文示例优化一个 LLM 调用，就能解决问题。

二、关于框架：用还是不用？

市面上有很多 LLM 编排框架，比如 LangChain、LlamaIndex，还有 Anthropic 自家的 Claude Agent SDK、AWS 的 Strands Agents SDK 等等。

这些框架确实能帮你快速搭建原型，省去很多重复劳动。但 Anthropic 也直言不讳地指出了它们的问题：

黑盒化严重：框架加了太多抽象层，你根本看不到发送给模型的真实 Prompt 和原始响应。
调试困难：出了问题，你很难判断是框架的锅还是 Prompt 的锅。
很容易让人陷入"为了用框架而用框架"的陷阱：框架提供了一堆花里胡哨的功能，诱惑你去构建复杂系统，但其实很多任务直接调 API 就能搞定。

所以 Anthropic 的建议是：

直接用 LLM 的原生 API。如果非要用框架，一定要搞懂它底层在干什么。

快速原型可以用框架，但上生产环境时，尽量减少抽象层。

三、五种 Workflow 模式，按需取用

好，接下来是干货部分。Anthropic 总结了五种常见的 Workflow 模式，从简单到复杂，覆盖了大多数实际场景。

模式一：Prompt 链（Chaining）

核心思想：把一个大任务拆成一串小任务，像手链一样串起来，一步一步执行。中间还可以加"检查站"（Gate），确保每一步的输出符合预期再往下走。

The prompt chaining workflow

什么时候用：任务可以被清晰地分解为多个子任务时。

为什么有效：降低单次任务的复杂度，提升准确率。让 LLM 每次只专注做好一件小事。

举个例子：

先生成一份营销文案，再翻译成多国语言
先写文章大纲，确认大纲没问题后，再根据大纲扩写正文

模式二：路由（Routing）

核心思想：先对用户输入进行分类，然后导向不同的处理流程。
The routing workflow

什么时候用：你有多个独立的任务类别，每个类别需要不同的处理逻辑。

为什么有效：职责分离。如果所有任务都挤在一个 Prompt 里，优化 A 任务可能会拖累 B 任务的表现。分开处理，各管各的。

举个例子：

客服系统：常见问题走 FAQ 流程，退款请求走退款流程，技术问题走技术支持流程
把简单任务路由给便宜的模型（如 Haiku），复杂任务路由给强力模型（如 Opus）——都是因为钱包兜不住啊

模式三：并行（Parallelization）

核心思想：让 LLM 同时处理多个任务，最后汇总结果。

The parallelization workflow
这种模式有两种玩法：

任务分解：把一个任务拆成多个独立的子任务，并行处理
投票机制：同一个任务跑多次，得到多样化的输出，综合判断

什么时候用：任务可以并行加速，或者需要从多个角度审视同一个问题。

举个例子：

任务分解：一个模型处理用户请求，另一个模型审核内容是否合规，比让同一个模型"既当运动员又当裁判"要靠谱得多
投票：用多个 Prompt 从不同维度检查代码安全漏洞，提高检测覆盖率

模式四：编排者-工作者（Orchestrator-Workers）

核心思想：一个"老板" LLM 负责拆解任务、分配工作，多个"打工仔" LLM 负责执行具体任务，最后老板汇总结果。

The orchestrator-workers workflow

什么时候用：你无法提前知道需要哪些子任务。

和并行模式的区别：并行模式的子任务是预先定义好的，编排者-工作者模式的子任务是动态生成的。

举个例子：

代码修改任务：你不知道需要改哪些文件、改多少，让编排者 LLM 先分析，再分配给工作者去执行
多源信息搜索：编排者决定搜索哪些来源，工作者分头执行，最后汇总

模式五：评估器-优化器（Evaluator-Optimizer）

核心思想：一个 LLM 负责生成结果，另一个 LLM 负责评估和反馈。如果不达标，就打回重做，循环往复，直到通过评估。

The evaluator-optimizer workflow

什么时候用：你有清晰的评估标准，并且迭代改进能带来实际价值。

举个例子：

文学翻译：第一次翻译可能有些细微之处没处理好，评估器指出问题，优化器再改一版
复杂搜索任务：可能需要多轮搜索才能获取全面信息，评估器决定是否需要继续

四、终于轮到真正的 Agent 了

聊完五种 Workflow，现在来说说真正的 Agent。

随着 LLM 在复杂推理、规划、工具调用、错误恢复等方面的能力日趋成熟，Agent 开始具备了进入生产环境的条件。

一个典型 Agent 的工作流程是这样的：

用户给出指令
Agent 自主规划和执行任务
执行过程中，根据环境反馈调整策略
遇到问题时，向用户请求帮助
任务完成或达到停止条件时结束

Autonomous agent

什么时候使用 Agent：

如果你无法为某个任务画出确定的流程图，并且愿意信任 AI 的自主判断，那就适合使用 Agent。

但这里有个重要提醒：

Agent 的自主性是有代价的——更高的成本、更多的 API 调用、以及错误可能层层累积的风险。

所以 Anthropic 建议：先在沙箱环境里充分测试，做好防护措施，再考虑上生产。

High-level flow of a coding agent

实际案例：

SWE-bench 任务：根据任务描述，让 Agent 自主修改多个代码文件
Claude Computer Use：让 Claude 像人一样操作电脑完成任务

五、这些模式不是教条，而是工具箱

Anthropic 特别强调：

这些模式不是必须遵循的流程，而是常见的设计参考。

你完全可以根据实际情况组合、变形、或者干脆不用。核心原则只有一条：

只有当增加复杂性确实能显著提升效果时，才值得引入。

六、结语：奥卡姆剃刀，永远不过时

读完 Anthropic 这篇文章，我最大的感受是：

在 AI 应用开发领域，奥卡姆剃刀原则依然是最高指导思想。

解决问题的关键，不在于你的系统有多复杂，而在于你是否构建了恰到好处的系统。

Anthropic 给出了三条核心原则：

保持简洁：能简单就别复杂
确保透明：让 Agent 的规划步骤清晰可见
打磨接口：工具文档写清楚，测试做充分

最后，再强调一遍那个朴素但重要的道理：

从简单的 Prompt 开始。只有当简单方案无法满足需求时，再考虑引入多步骤的 Agentic 系统。

别为了 Agent 而 Agent。

原文链接：Building Effective Agents - Anthropic

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

实战系列APP---做啥子嘛(1):了解应用开发环境

2048 AI社区

破解遗留代码的逆向工程秘笈

这篇综述通过对 83 篇学术论文的系统性回顾，让我们得以一窥软件逆向工程领域的真实面貌。这些发现共同描绘了一幅复杂的图景：这是一个以理解为基石、以实用主义为主导的领域，但其学术焦点却与最棘手的工业难题存在偏差，并且正处在两种不同范式和人工智能新机遇所驱动的深刻变革前夜。核心思想依然明确：在软件系统日益复杂的今天，理解并演进遗留系统是一个永恒的挑战，而模型驱动的方法为此提供了结构化、系统化的解决方案