写在前面: 深夜撸完这几节课的代码,我最大的感受是:属于大模型开发的“草莽时代”正在结束,工程化的正规军已经入场。

如果说之前的理论课是在探讨“大模型应该长什么脑子”,那么这几节课就是手把手教我们**“如何给这个大脑装上不同的躯干,并投入到真实的生产线中”**。下面是我结合代码实操后的深度复盘与架构思考。

 一、 Skills with the Claude API:赋予 Agent 操作系统级别的“越狱”能力

在过去,我们调用大模型的 API,往往只是在做一个“高级自动回复机”:发送一段文本,接收一段文本。但在这一章,课程展示了如何通过 API 实现真正的系统级操作。

打通物理世界的壁垒:课程演示了如何将自定义或预置的 Skills 与 Claude API 结合,其核心突破在于集成了代码执行工具(Code Execution Tool)和文件 API(Files API)

Bash 与文件系统权限:这意味着什么?意味着我们直接为 Claude 装备了读取本地文件系统的权限,并赋予了它使用 Bash 环境直接在我们的电脑上执行 Python 脚本的能力。

架构师视角的思考:Agent 不再是一个被锁在浏览器里的聊天框。当你通过 API 让它挂载上特定的 Skill 时,它可以自主读取你本地的一个脏数据表,写一段 Python 脚本进行清洗,运行这段脚本,然后把干净的数据保存在你的桌面上。这就是构建无人工干预(Human-out-of-the-loop)全自动化工作流的技术底座。

当我们让 Claude 创建并执行文件时,这些操作会在一个安全且隔离的环境中进行。该环境对内存、磁盘、CPU 等资源都有限制,更重要的是,它没有互联网连接,并且预装了一些开箱即用的库。因此,它并非适用于所有类型的编码环境。这里有一些需要注意的限制。

同时,我们也可以访问一个文件系统,并开始在其中添加目录。

注意:这种无互联网连接的限制是 Messages API 特有的。当我们在 Claude AI 或 Claude Desktop 中使用代码执行工具时,我们是可以访问互联网的,并且可以下载和安装包。

作者建议:

关于学习曲线:说实话,从 Claude AI 的图形界面转到纯 API 编程,确实需要一点适应时间。但一旦你理解了代码执行工具和 Files API 的协作方式,会发现这种编程方式给了你前所未有的控制力。图形界面适合快速验证想法,而 API 则适合构建可扩展的生产级应用。

关于技能的可移植性:正如前面提到的,技能在不同环境间不共享确实是个痛点。我的建议是:

  • 把技能文件存放在一个独立的项目目录中
  • 为每个技能编写清晰的 README 文档
  • 考虑创建一个"技能启动脚本",自动化部署流程

关于安全性和沙箱限制:无互联网访问的沙箱环境初看是个限制,但从安全角度看这是明智的设计。如果你需要联网功能,可以在容器外预先下载数据,或者使用其他 API 配合。记住:限制往往能激发更优雅的解决方案。

 二、 Skills with Claude Code:程序员的终极自动化工作流

这一节专门针对我们开发者的日常痛点,演示了如何在 Anthropic 官方的命令行开发环境 Claude Code 中深度使用 Skills。

将“代码规范”固化为资产:我们学习了如何利用 Skills 构建代码生成、代码审查(Code Review)以及自动化测试的完整工作流1。你可以把团队里最资深架构师的 Code Review 标准写进 SKILL.md,从今往后,Agent 每次都会用这套最高标准来帮你把关代码。

核心亮点:Subagents(子智能体)的惊艳解耦:这是本章乃至整个架构设计中最让我拍案叫绝的概念。在处理极度复杂的开发任务时,试图用一个拥有超长上下文的单一 Agent 去解决所有问题,往往会导致“灾难性遗忘”和幻觉。课程教我们如何设置多个 Subagents,并为这些子智能体分别配备专属的专业技能

上下文隔离(Isolated Context):主 Agent 就像是技术总监(CTO)负责需求拆解与调度,而 Subagents 则是各个方向的专员。每个 Subagent 在处理特定任务时,都拥有完全独立的隔离上下文。这种解耦设计,完美解决了超长 Prompt 带来的性能衰减问题。

下载VS-Code拓展成功,但注册时因为没有外国手机号激活失败:,如果有朋友知道如何解决欢迎指导,感谢!

 三、 Skills with the Claude Agent SDK:构建极其复杂的业务系统

如果说 Claude Code 是针对日常开发的开箱即用,那么 Agent SDK 则为我们提供了最高级别的底层定制自由度。

实战案例:Research Agent(深度调研智能体):课程带我们用 SDK 从零手搓了一个具有极高业务价值的调研 Agent。

多源信息融合:在这个项目中,Agent 挂载了特定的 Skill,被要求根据一个开源工具的官方文档、GitHub 仓库数据,以及 Web 搜索结果,自动整合并生成一份系统化的学习指南

架构师视角的思考:这个案例是 MCP(模型上下文协议)与 Skills 结合的完美体现。Agent 表现出了极强的自主决策能力——它知道什么时候该去翻 GitHub 的源码,什么时候该去搜索引擎里查最新资讯。这种将离散的异构数据抓取、清洗、融合并最终结构化输出的能力,不仅可以用来写学习指南,完全可以平移到“全自动行业研报生成”或“竞品分析”等高阶商业场景中。

实战案例复盘:

构建 Research Agent(深度调研智能体) 在这一章的实战中,我们被指导手搓了一个极具业务价值的调研智能体。我们为这个 Agent 挂载了一个特定的 Skill,它的任务是:针对某个开源工具,自动整合并生成一份系统化、高质量的学习指南。 为了完成这个看似简单的任务,Agent 需要自主决策去调用不同的外部数据源:去查阅枯燥的官方文档、去抓取 GitHub 仓库的真实代码和状态,还要结合 Web 网络搜索引擎获取最新的全网资讯。

核心思考结果:我们从这个案例中验证了什么?

跑通这段 SDK 代码,并看到终端里输出那份条理清晰、数据详实的“学习指南”时,我对着屏幕进行了深度的架构推演,得出了以下三个维度的思考结果:

思考结果一:验证了 Agent 进行“异构数据交叉验证”的能力,而非简单的文本总结。 过去我们让大模型写文章,它往往是基于已有训练数据的“凭空捏造”(容易幻觉),或者是对单一输入文档的“强行缩水”。但在这个案例中,Agent 展现出了类似人类资深研究员的工作流。它不仅仅是看了官方文档(获取理论),还会去 GitHub 看真实的 Repo 数据(结合实践),最后再通过网页搜索去查缺补漏(补充最新动态)。

最终的产出结果证明:通过 SDK 与 Skills 的结合,Agent 完全有能力打破各个平台的信息孤岛,对不同格式的数据进行交叉验证,从而生成具有极高事实准确度和时效性的专业报告。

思考结果二:实现了从“被动响应”到“主动任务编排”的系统跃迁。 这是我在工程层面的最大震撼。在这个 SDK 案例中,我们并没有写死代码去规定“第一步搜网页、第二步查 GitHub”。相反,我们将调研的方法论和专家经验固化在了 SKILL.md 中。

系统运行的逻辑结果表明:Agent 在执行过程中展现出了强大的“自主决策意识”。它在阅读完一部分基础文档后,会自动评估当前收集的信息是否足够完成那份“学习指南”;如果发现不够,它会自主规划下一步的行动(发起新的网络搜索或代码查询)。这种化被动为主动的动态编排能力,是以前写死逻辑的传统脚本所无法企及的。

思考结果三:降维打击的商业化落地潜力(破圈推演)。 虽然课程出于教学目的,演示的仅仅是生成一份“开源工具的入门指南”,但我顺着这个架构往下推演,得出的商业化思考结果是极其惊人的:这套 SDK 架构的底层逻辑,可以“无损平移”到无数个高净值的垂直行业中。 试想一下,如果你把底层连接的数据源从“GitHub 和技术文档”换成“各大金融数据库和上市公司年报”,它瞬间就变成了一个能全天候运作的“自动化金融分析师”;如果你把它换成“竞品官网、专利库和行业新闻”,它就是一个“商业情报挖掘专家”。

 四、 Conclusion (课程总结):迎接“标准化”的 Agent 时代

从“通用型”到“专家化”:通过使用开放标准格式(Open Standard Format),我们可以随时将一个博而不精的通用 Agent,按需转化为特定领域的顶级专家。

告别重复造轮子:无论是进行代码审查、标准化数据分析,还是构建复杂的调研网络,将这些工作流封装打包为 Skill,意味着我们真正实现了“构建一次,即可在任何兼容的 Agent 上随处部署”(build them once and deploy across any skills-compatible agent)。

--------------------------------------------------------------------------------

 结语与特别致谢

Agent 的开发已经从玄学般的“提示词微调”,正式迈入了严谨的“软件工程学”。掌握了 Skills、MCP 与 Subagents 的系统架构,就是掌握了下一个时代 AI 应用开发的通关密码。

最后,我想在这个实战篇的结尾,特别致敬一下 Datawhale 开源社区的幕后英雄们。这门包含大量前沿代码和抽象概念的课程,能够以如此顺畅的形式呈现给中文开发者,离不开负责这几章翻译与技术核查的李智江、陈辅元、查昊南、邓一纯等同学。是社区的开源共建,让我们得以跨越语言和认知的壁垒,站在巨人的肩膀上眺望未来。

代码已经跑通,属于我们自己的 Agent 宇宙才刚刚开始。大家加油!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐