【Datawhale 组队学习】Agent 架构:API、Claude Code 与 SDK 落地
摘要: 本文探讨了大模型开发从"草莽时代"向工程化转型的趋势,重点分析了Claude API、Claude Code和Agent SDK三大工具的技术突破与应用场景。通过代码实操,作者展示了如何赋予Agent操作系统级能力(如文件读写、Bash执行)、构建自动化开发工作流(代码生成/审查),以及设计复杂业务系统(如多源信息融合的调研Agent)。文章强调了"子智能体"架构的解耦优势、标准化Skil
写在前面: 深夜撸完这几节课的代码,我最大的感受是:属于大模型开发的“草莽时代”正在结束,工程化的正规军已经入场。
如果说之前的理论课是在探讨“大模型应该长什么脑子”,那么这几节课就是手把手教我们**“如何给这个大脑装上不同的躯干,并投入到真实的生产线中”**。下面是我结合代码实操后的深度复盘与架构思考。
一、 Skills with the Claude API:赋予 Agent 操作系统级别的“越狱”能力
在过去,我们调用大模型的 API,往往只是在做一个“高级自动回复机”:发送一段文本,接收一段文本。但在这一章,课程展示了如何通过 API 实现真正的系统级操作。
• 打通物理世界的壁垒:课程演示了如何将自定义或预置的 Skills 与 Claude API 结合,其核心突破在于集成了代码执行工具(Code Execution Tool)和文件 API(Files API)。
• Bash 与文件系统权限:这意味着什么?意味着我们直接为 Claude 装备了读取本地文件系统的权限,并赋予了它使用 Bash 环境直接在我们的电脑上执行 Python 脚本的能力。
• 架构师视角的思考:Agent 不再是一个被锁在浏览器里的聊天框。当你通过 API 让它挂载上特定的 Skill 时,它可以自主读取你本地的一个脏数据表,写一段 Python 脚本进行清洗,运行这段脚本,然后把干净的数据保存在你的桌面上。这就是构建无人工干预(Human-out-of-the-loop)全自动化工作流的技术底座。
当我们让 Claude 创建并执行文件时,这些操作会在一个安全且隔离的环境中进行。该环境对内存、磁盘、CPU 等资源都有限制,更重要的是,它没有互联网连接,并且预装了一些开箱即用的库。因此,它并非适用于所有类型的编码环境。这里有一些需要注意的限制。
同时,我们也可以访问一个文件系统,并开始在其中添加目录。
注意:这种无互联网连接的限制是 Messages API 特有的。当我们在 Claude AI 或 Claude Desktop 中使用代码执行工具时,我们是可以访问互联网的,并且可以下载和安装包。

作者建议:
关于学习曲线:说实话,从 Claude AI 的图形界面转到纯 API 编程,确实需要一点适应时间。但一旦你理解了代码执行工具和 Files API 的协作方式,会发现这种编程方式给了你前所未有的控制力。图形界面适合快速验证想法,而 API 则适合构建可扩展的生产级应用。
关于技能的可移植性:正如前面提到的,技能在不同环境间不共享确实是个痛点。我的建议是:
- 把技能文件存放在一个独立的项目目录中
- 为每个技能编写清晰的 README 文档
- 考虑创建一个"技能启动脚本",自动化部署流程
关于安全性和沙箱限制:无互联网访问的沙箱环境初看是个限制,但从安全角度看这是明智的设计。如果你需要联网功能,可以在容器外预先下载数据,或者使用其他 API 配合。记住:限制往往能激发更优雅的解决方案。
二、 Skills with Claude Code:程序员的终极自动化工作流
这一节专门针对我们开发者的日常痛点,演示了如何在 Anthropic 官方的命令行开发环境 Claude Code 中深度使用 Skills。
• 将“代码规范”固化为资产:我们学习了如何利用 Skills 构建代码生成、代码审查(Code Review)以及自动化测试的完整工作流1。你可以把团队里最资深架构师的 Code Review 标准写进 SKILL.md,从今往后,Agent 每次都会用这套最高标准来帮你把关代码。
• 核心亮点:Subagents(子智能体)的惊艳解耦:这是本章乃至整个架构设计中最让我拍案叫绝的概念。在处理极度复杂的开发任务时,试图用一个拥有超长上下文的单一 Agent 去解决所有问题,往往会导致“灾难性遗忘”和幻觉。课程教我们如何设置多个 Subagents,并为这些子智能体分别配备专属的专业技能。
• 上下文隔离(Isolated Context):主 Agent 就像是技术总监(CTO)负责需求拆解与调度,而 Subagents 则是各个方向的专员。每个 Subagent 在处理特定任务时,都拥有完全独立的隔离上下文。这种解耦设计,完美解决了超长 Prompt 带来的性能衰减问题。

下载VS-Code拓展成功,但注册时因为没有外国手机号激活失败:
,如果有朋友知道如何解决欢迎指导,感谢!
三、 Skills with the Claude Agent SDK:构建极其复杂的业务系统
如果说 Claude Code 是针对日常开发的开箱即用,那么 Agent SDK 则为我们提供了最高级别的底层定制自由度。
• 实战案例:Research Agent(深度调研智能体):课程带我们用 SDK 从零手搓了一个具有极高业务价值的调研 Agent。
• 多源信息融合:在这个项目中,Agent 挂载了特定的 Skill,被要求根据一个开源工具的官方文档、GitHub 仓库数据,以及 Web 搜索结果,自动整合并生成一份系统化的学习指南。

• 架构师视角的思考:这个案例是 MCP(模型上下文协议)与 Skills 结合的完美体现。Agent 表现出了极强的自主决策能力——它知道什么时候该去翻 GitHub 的源码,什么时候该去搜索引擎里查最新资讯。这种将离散的异构数据抓取、清洗、融合并最终结构化输出的能力,不仅可以用来写学习指南,完全可以平移到“全自动行业研报生成”或“竞品分析”等高阶商业场景中。
实战案例复盘:
构建 Research Agent(深度调研智能体) 在这一章的实战中,我们被指导手搓了一个极具业务价值的调研智能体。我们为这个 Agent 挂载了一个特定的 Skill,它的任务是:针对某个开源工具,自动整合并生成一份系统化、高质量的学习指南。 为了完成这个看似简单的任务,Agent 需要自主决策去调用不同的外部数据源:去查阅枯燥的官方文档、去抓取 GitHub 仓库的真实代码和状态,还要结合 Web 网络搜索引擎获取最新的全网资讯。
核心思考结果:我们从这个案例中验证了什么?
跑通这段 SDK 代码,并看到终端里输出那份条理清晰、数据详实的“学习指南”时,我对着屏幕进行了深度的架构推演,得出了以下三个维度的思考结果:
• 思考结果一:验证了 Agent 进行“异构数据交叉验证”的能力,而非简单的文本总结。 过去我们让大模型写文章,它往往是基于已有训练数据的“凭空捏造”(容易幻觉),或者是对单一输入文档的“强行缩水”。但在这个案例中,Agent 展现出了类似人类资深研究员的工作流。它不仅仅是看了官方文档(获取理论),还会去 GitHub 看真实的 Repo 数据(结合实践),最后再通过网页搜索去查缺补漏(补充最新动态)。
最终的产出结果证明:通过 SDK 与 Skills 的结合,Agent 完全有能力打破各个平台的信息孤岛,对不同格式的数据进行交叉验证,从而生成具有极高事实准确度和时效性的专业报告。
• 思考结果二:实现了从“被动响应”到“主动任务编排”的系统跃迁。 这是我在工程层面的最大震撼。在这个 SDK 案例中,我们并没有写死代码去规定“第一步搜网页、第二步查 GitHub”。相反,我们将调研的方法论和专家经验固化在了 SKILL.md 中。
系统运行的逻辑结果表明:Agent 在执行过程中展现出了强大的“自主决策意识”。它在阅读完一部分基础文档后,会自动评估当前收集的信息是否足够完成那份“学习指南”;如果发现不够,它会自主规划下一步的行动(发起新的网络搜索或代码查询)。这种化被动为主动的动态编排能力,是以前写死逻辑的传统脚本所无法企及的。
• 思考结果三:降维打击的商业化落地潜力(破圈推演)。 虽然课程出于教学目的,演示的仅仅是生成一份“开源工具的入门指南”,但我顺着这个架构往下推演,得出的商业化思考结果是极其惊人的:这套 SDK 架构的底层逻辑,可以“无损平移”到无数个高净值的垂直行业中。 试想一下,如果你把底层连接的数据源从“GitHub 和技术文档”换成“各大金融数据库和上市公司年报”,它瞬间就变成了一个能全天候运作的“自动化金融分析师”;如果你把它换成“竞品官网、专利库和行业新闻”,它就是一个“商业情报挖掘专家”。
四、 Conclusion (课程总结):迎接“标准化”的 Agent 时代
• 从“通用型”到“专家化”:通过使用开放标准格式(Open Standard Format),我们可以随时将一个博而不精的通用 Agent,按需转化为特定领域的顶级专家。
• 告别重复造轮子:无论是进行代码审查、标准化数据分析,还是构建复杂的调研网络,将这些工作流封装打包为 Skill,意味着我们真正实现了“构建一次,即可在任何兼容的 Agent 上随处部署”(build them once and deploy across any skills-compatible agent)。
--------------------------------------------------------------------------------
结语与特别致谢
Agent 的开发已经从玄学般的“提示词微调”,正式迈入了严谨的“软件工程学”。掌握了 Skills、MCP 与 Subagents 的系统架构,就是掌握了下一个时代 AI 应用开发的通关密码。
最后,我想在这个实战篇的结尾,特别致敬一下 Datawhale 开源社区的幕后英雄们。这门包含大量前沿代码和抽象概念的课程,能够以如此顺畅的形式呈现给中文开发者,离不开负责这几章翻译与技术核查的李智江、陈辅元、查昊南、邓一纯等同学。是社区的开源共建,让我们得以跨越语言和认知的壁垒,站在巨人的肩膀上眺望未来。
代码已经跑通,属于我们自己的 Agent 宇宙才刚刚开始。大家加油!
更多推荐

所有评论(0)