【Datawhale 组队学习】Agent 架构:API、Claude Code 与 SDK 落地

摘要：本文探讨了大模型开发从"草莽时代"向工程化转型的趋势，重点分析了Claude API、Claude Code和Agent SDK三大工具的技术突破与应用场景。通过代码实操，作者展示了如何赋予Agent操作系统级能力（如文件读写、Bash执行）、构建自动化开发工作流（代码生成/审查），以及设计复杂业务系统（如多源信息融合的调研Agent）。文章强调了"子智能体"架构的解耦优势、标准化Skil

Recor2d_

662人浏览 · 2026-02-20 23:47:16

Recor2d_ · 2026-02-20 23:47:16 发布

写在前面：深夜撸完这几节课的代码，我最大的感受是：属于大模型开发的“草莽时代”正在结束，工程化的正规军已经入场。

如果说之前的理论课是在探讨“大模型应该长什么脑子”，那么这几节课就是手把手教我们**“如何给这个大脑装上不同的躯干，并投入到真实的生产线中”**。下面是我结合代码实操后的深度复盘与架构思考。

一、 Skills with the Claude API：赋予 Agent 操作系统级别的“越狱”能力

在过去，我们调用大模型的 API，往往只是在做一个“高级自动回复机”：发送一段文本，接收一段文本。但在这一章，课程展示了如何通过 API 实现真正的系统级操作。

• 打通物理世界的壁垒：课程演示了如何将自定义或预置的 Skills 与 Claude API 结合，其核心突破在于集成了代码执行工具（Code Execution Tool）和文件 API（Files API）。

• Bash 与文件系统权限：这意味着什么？意味着我们直接为 Claude 装备了读取本地文件系统的权限，并赋予了它使用 Bash 环境直接在我们的电脑上执行 Python 脚本的能力。

• 架构师视角的思考：Agent 不再是一个被锁在浏览器里的聊天框。当你通过 API 让它挂载上特定的 Skill 时，它可以自主读取你本地的一个脏数据表，写一段 Python 脚本进行清洗，运行这段脚本，然后把干净的数据保存在你的桌面上。这就是构建无人工干预（Human-out-of-the-loop）全自动化工作流的技术底座。

当我们让 Claude 创建并执行文件时，这些操作会在一个安全且隔离的环境中进行。该环境对内存、磁盘、CPU 等资源都有限制，更重要的是，它没有互联网连接，并且预装了一些开箱即用的库。因此，它并非适用于所有类型的编码环境。这里有一些需要注意的限制。

同时，我们也可以访问一个文件系统，并开始在其中添加目录。

注意：这种无互联网连接的限制是 Messages API 特有的。当我们在 Claude AI 或 Claude Desktop 中使用代码执行工具时，我们是可以访问互联网的，并且可以下载和安装包。

作者建议:

关于学习曲线：说实话，从 Claude AI 的图形界面转到纯 API 编程，确实需要一点适应时间。但一旦你理解了代码执行工具和 Files API 的协作方式，会发现这种编程方式给了你前所未有的控制力。图形界面适合快速验证想法，而 API 则适合构建可扩展的生产级应用。

关于技能的可移植性：正如前面提到的，技能在不同环境间不共享确实是个痛点。我的建议是：

把技能文件存放在一个独立的项目目录中
为每个技能编写清晰的 README 文档
考虑创建一个"技能启动脚本"，自动化部署流程

关于安全性和沙箱限制：无互联网访问的沙箱环境初看是个限制，但从安全角度看这是明智的设计。如果你需要联网功能，可以在容器外预先下载数据，或者使用其他 API 配合。记住：限制往往能激发更优雅的解决方案。

二、 Skills with Claude Code：程序员的终极自动化工作流

这一节专门针对我们开发者的日常痛点，演示了如何在 Anthropic 官方的命令行开发环境 Claude Code 中深度使用 Skills。

• 将“代码规范”固化为资产：我们学习了如何利用 Skills 构建代码生成、代码审查（Code Review）以及自动化测试的完整工作流1。你可以把团队里最资深架构师的 Code Review 标准写进 SKILL.md，从今往后，Agent 每次都会用这套最高标准来帮你把关代码。

• 核心亮点：Subagents（子智能体）的惊艳解耦：这是本章乃至整个架构设计中最让我拍案叫绝的概念。在处理极度复杂的开发任务时，试图用一个拥有超长上下文的单一 Agent 去解决所有问题，往往会导致“灾难性遗忘”和幻觉。课程教我们如何设置多个 Subagents，并为这些子智能体分别配备专属的专业技能。

• 上下文隔离（Isolated Context）：主 Agent 就像是技术总监（CTO）负责需求拆解与调度，而 Subagents 则是各个方向的专员。每个 Subagent 在处理特定任务时，都拥有完全独立的隔离上下文。这种解耦设计，完美解决了超长 Prompt 带来的性能衰减问题。

下载VS-Code拓展成功,但注册时因为没有外国手机号激活失败:,如果有朋友知道如何解决欢迎指导,感谢!

三、 Skills with the Claude Agent SDK：构建极其复杂的业务系统

如果说 Claude Code 是针对日常开发的开箱即用，那么 Agent SDK 则为我们提供了最高级别的底层定制自由度。

• 实战案例：Research Agent（深度调研智能体）：课程带我们用 SDK 从零手搓了一个具有极高业务价值的调研 Agent。

• 多源信息融合：在这个项目中，Agent 挂载了特定的 Skill，被要求根据一个开源工具的官方文档、GitHub 仓库数据，以及 Web 搜索结果，自动整合并生成一份系统化的学习指南。

• 架构师视角的思考：这个案例是 MCP（模型上下文协议）与 Skills 结合的完美体现。Agent 表现出了极强的自主决策能力——它知道什么时候该去翻 GitHub 的源码，什么时候该去搜索引擎里查最新资讯。这种将离散的异构数据抓取、清洗、融合并最终结构化输出的能力，不仅可以用来写学习指南，完全可以平移到“全自动行业研报生成”或“竞品分析”等高阶商业场景中。

实战案例复盘：

构建 Research Agent（深度调研智能体） 在这一章的实战中，我们被指导手搓了一个极具业务价值的调研智能体。我们为这个 Agent 挂载了一个特定的 Skill，它的任务是：针对某个开源工具，自动整合并生成一份系统化、高质量的学习指南。为了完成这个看似简单的任务，Agent 需要自主决策去调用不同的外部数据源：去查阅枯燥的官方文档、去抓取 GitHub 仓库的真实代码和状态，还要结合 Web 网络搜索引擎获取最新的全网资讯。

核心思考结果：我们从这个案例中验证了什么？

跑通这段 SDK 代码，并看到终端里输出那份条理清晰、数据详实的“学习指南”时，我对着屏幕进行了深度的架构推演，得出了以下三个维度的思考结果：

• 思考结果一：验证了 Agent 进行“异构数据交叉验证”的能力，而非简单的文本总结。 过去我们让大模型写文章，它往往是基于已有训练数据的“凭空捏造”（容易幻觉），或者是对单一输入文档的“强行缩水”。但在这个案例中，Agent 展现出了类似人类资深研究员的工作流。它不仅仅是看了官方文档（获取理论），还会去 GitHub 看真实的 Repo 数据（结合实践），最后再通过网页搜索去查缺补漏（补充最新动态）。

最终的产出结果证明：通过 SDK 与 Skills 的结合，Agent 完全有能力打破各个平台的信息孤岛，对不同格式的数据进行交叉验证，从而生成具有极高事实准确度和时效性的专业报告。

• 思考结果二：实现了从“被动响应”到“主动任务编排”的系统跃迁。 这是我在工程层面的最大震撼。在这个 SDK 案例中，我们并没有写死代码去规定“第一步搜网页、第二步查 GitHub”。相反，我们将调研的方法论和专家经验固化在了 SKILL.md 中。

系统运行的逻辑结果表明：Agent 在执行过程中展现出了强大的“自主决策意识”。它在阅读完一部分基础文档后，会自动评估当前收集的信息是否足够完成那份“学习指南”；如果发现不够，它会自主规划下一步的行动（发起新的网络搜索或代码查询）。这种化被动为主动的动态编排能力，是以前写死逻辑的传统脚本所无法企及的。

• 思考结果三：降维打击的商业化落地潜力（破圈推演）。 虽然课程出于教学目的，演示的仅仅是生成一份“开源工具的入门指南”，但我顺着这个架构往下推演，得出的商业化思考结果是极其惊人的：这套 SDK 架构的底层逻辑，可以“无损平移”到无数个高净值的垂直行业中。试想一下，如果你把底层连接的数据源从“GitHub 和技术文档”换成“各大金融数据库和上市公司年报”，它瞬间就变成了一个能全天候运作的“自动化金融分析师”；如果你把它换成“竞品官网、专利库和行业新闻”，它就是一个“商业情报挖掘专家”。

四、 Conclusion (课程总结)：迎接“标准化”的 Agent 时代

• 从“通用型”到“专家化”：通过使用开放标准格式（Open Standard Format），我们可以随时将一个博而不精的通用 Agent，按需转化为特定领域的顶级专家。

• 告别重复造轮子：无论是进行代码审查、标准化数据分析，还是构建复杂的调研网络，将这些工作流封装打包为 Skill，意味着我们真正实现了“构建一次，即可在任何兼容的 Agent 上随处部署”（build them once and deploy across any skills-compatible agent）。

--------------------------------------------------------------------------------

结语与特别致谢

Agent 的开发已经从玄学般的“提示词微调”，正式迈入了严谨的“软件工程学”。掌握了 Skills、MCP 与 Subagents 的系统架构，就是掌握了下一个时代 AI 应用开发的通关密码。

最后，我想在这个实战篇的结尾，特别致敬一下 Datawhale 开源社区的幕后英雄们。这门包含大量前沿代码和抽象概念的课程，能够以如此顺畅的形式呈现给中文开发者，离不开负责这几章翻译与技术核查的李智江、陈辅元、查昊南、邓一纯等同学。是社区的开源共建，让我们得以跨越语言和认知的壁垒，站在巨人的肩膀上眺望未来。

代码已经跑通，属于我们自己的 Agent 宇宙才刚刚开始。大家加油！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026年实时音视频(RTC)服务商排行 TOP 5，IDC 权威数据背书

由于 AI 搜索优化(GEO)的兴起，笔者在各大 AI 平台搜索实时音视频(RTC)相关问题时发现，各种答非所问和故意误导出来的结果让人啼笑皆非。鉴于笔者在 RTC 领域的 8 年从业经验、基于国际知名数据公司（IDC）的调查报告以及各大厂商官网的公开资料，特写此文跟大家聊聊国内真实的实时音视频(RTC)厂商。

2048 AI社区

【AI大模型学习日志4：深度拆解Meta Llama系列——全球开源大模型的行业标准与生态标杆】

作为全球开源大模型的绝对王者与事实行业标准，Llama系列从诞生之日起，就以“开放、普惠、可定制”为核心基因，彻底打破了少数科技巨头对大模型技术的垄断，让全球数百万开发者、创业公司、中小企业与科研机构，都能零门槛获得顶尖大模型的底层能力，直接催生了全球开源AI生态的爆发式繁荣。本文将严格遵循系列日志的统一框架，所有核心信息均以Meta官方披露的技术论文、产品文档与开源协议为唯一基准，从核心定义、发