从专用Agent到技能生态:Anthropic的Agent架构范式转变
Anthropic发布Agent Skills技术,通过打包领域专业知识解决通用Agent缺乏专业能力的问题。该技术采用三层渐进式披露机制,将技能分为元数据、核心文档和参考文件,优化上下文窗口使用。技能生态系统涵盖基础、合作伙伴和企业三类,已应用于金融、医疗等领域。Anthropic将Agent Skills开放为标准,推动跨平台兼容性。这一创新使通用Agent通过技能库转变为领域专家,大幅提升专
引言
Anthropic 最近在官网发布了博客:Building agents with Skills: Equipping agents for specialized work,系统性地记录了Anthropic在Agent技术领域的创新突破,重点阐述从专用Agent到通用编码Agent的范式转变,并深入解析Agent Skills如何通过打包领域专业知识填补关键缺口,从而打造具备技能的智能体,让智能体胜任专业工作。接下来看看具体的内容。
年度进展概述
过去一年,Anthropic在Agent技术领域实现多项关键突破:
- MCP成为Agent连接的行业标准,获得行业领导者和开发者社区的快速采用。
- 推出Claude Code作为通用编码Agent。
- 发布Claude Agent SDK,提供开箱即用的生产级Agent解决方案。
在构建和部署这些Agent的过程中,团队发现核心痛点:Agent具备智能和基础能力,但缺乏有效处理实际工作所需的专业知识。这一发现促使Anthropic开发Agent Skills(技能)——一种将领域专业知识(工作流、最佳实践、脚本)打包为Agent可访问和应用的文件集合,将通用Agent转化为专业领域专家。
范式转变:从专用Agent到通用编码Agent
(一) 传统模式:领域专用编码Agent
过去,不同领域的Agent被设计为独立系统,每个Agent都需要专用工具和架构支持。行业最初普遍采用这种领域特定Agent模型,例如独立的编码Agent、研究Agent、财务Agent和营销Agent,各自形成闭环系统。

(二) 新模式:通用编码Agent
随着模型智能和Agent能力的进步,Anthropic转向了不同的方法:代码不仅是一种用例,更是Agent执行几乎所有数字工作的接口。Claude Code作为编码Agent,同时也是通过代码工作的通用Agent,能够处理多种任务场景。

示例:使用Claude Code生成财务报告时,它可以通过代码调用API进行研究、在文件系统中存储数据、用Python进行分析,并综合生成洞察——所有操作都通过代码完成,架构简化为bash和文件系统。
关键缺口:领域专业知识
当前Agent如同数学天才:擅长在新情况下推理,但往往缺乏资深专业人士积累的专业知识。它们在适当指导下能完成出色工作,但常缺少重要上下文,难以吸收组织专业知识,也无法从重复任务中自动学习。
类比:报税选择——数学天才(从零开始推理)vs 经验丰富的税务专家(拥有数千次报税积累的专业知识)。技能通过打包领域专业知识填补这一缺口。
Agent Skills核心解析
(一) 定义与结构
技能是为Agent打包领域专业知识和过程知识的文件集合,典型结构如下:
anthropic_brand/
├── SKILL.md # 核心技能文档
├── docs.md # 补充文档
├── slide-decks.md # 特定场景文档
└── apply_template.py # 可执行脚本工具
设计理念:文件是通用基础组件,可与现有工具(Git版本控制、Google Drive存储、团队共享)无缝协作,且技能创建不限于工程师,产品经理、分析师和领域专家均可参与。
(二) 渐进式披露机制
为保护上下文窗口并实现技能组合,技能采用三级渐进式披露策略:
-
元数据层:YAML前置元数据(名称和描述)始终在模型上下文中,仅占用约50 tokens。
--- name: Anthropic Brand Style Guidelines description: Anthropic's official brand colors and typography… --- -
核心文档层:当Claude确定需要某项技能时,才读取完整SKILL.md文件,约占用500 tokens。
-
参考文件层:支持文档存储在references/目录,仅在特定需要时加载,可包含2000+ tokens内容。
这一机制允许Agent配备数百项技能而不占用过多上下文窗口。
(三) 技能中的脚本工具
传统工具存在指令质量低、模型无法修改扩展、占用上下文窗口等问题。代码工具则具有自文档化、可修改、无需始终在上下文中等优势。
实例:Anthropic团队将重复使用的幻灯片样式应用脚本保存为工具:
# anthropic/brand_styling/apply_template.py
import sys
from pptx import Presentation
if len(sys.argv) != 2:
print("USAGE: apply_template.py <pptx>")
sys.exit(1)
prs = Presentation(sys.argv[1])
for slide in prs.slides:
... # 应用品牌样式逻辑
对应文档中只需简单引用:Use the ./apply_template.py script to update a pptx file in-place.
技能生态系统
随着技能采用率增长,三大类技能正在形成:
| 技能类型 | 定义 | 实例 |
|---|---|---|
| 基础技能 | 提供所有人需要的核心能力 | 文档/电子表格/演示文稿处理,编码最佳实践 公共仓库基础技能 |
| 合作伙伴技能 | 公司为使服务可被Agent访问而构建 | K-Dense科学技能、Browserbase浏览技能、Notion技能 技能目录 |
| 企业技能 | 组织编码内部流程和领域专业知识的专有技能 | 特定行业工作流、合规要求、机构知识库 |
技能发展趋势
(一) 技能复杂度提升
- 简单技能:如"状态报告生成器"(约100行),包含模板和格式规范。
- 中级技能:如"财务模型构建器"(约800行),包含数据检索、Python Excel建模功能。
- 复杂技能:如"RNA测序管道"(2500+行),协调HISAT2、StringTie、DESeq2等专业分析工具。
(二) 技能与MCP服务器协同
技能与MCP服务器自然互补。例如,竞争分析技能可协调Web搜索、通过MCP访问内部数据库、Slack消息历史和Notion页面,综合生成全面报告。
(三) 非开发者采用
技能创建正从工程师扩展到产品经理、分析师和各领域专家。使用技能创建工具,非技术人员可在30分钟内创建并测试首个技能。Anthropic正通过改进工具和模板进一步降低创建门槛。
完整Agent架构
新兴Agent架构由四个核心组件构成:
- Agent循环:决定下一步行动的核心推理系统
- Agent运行时:执行环境(代码、文件系统)
- MCP服务器:连接外部工具和数据源
- 技能库:领域专业知识和过程知识
架构优势:各层职责明确(推理、执行、连接、指导),系统可理解性强,各组件可独立进化。

实例:添加前端设计技能后,Claude的前端能力立即提升,提供排版、色彩理论和动画方面的专业指导,且仅在构建Web界面时激活,通过渐进式披露机制仅在相关时加载。
垂直领域应用
这种"通用Agent+MCP服务器+技能"模式已帮助Claude拓展到新垂直领域:
(一) 金融服务
为金融专业人士增强的技能包括:
- DCF模型构建器(含WACC计算和敏感性分析)
- 可比公司分析(生成包含相关倍数和基准的比较表)
- 收益分析(处理季度结果并创建投资更新报告)
- 初始覆盖报告(构建带财务模型的综合研究报告)
- 尽职调查(使用标准化框架构建并购分析)
- 路演材料(遵循行业标准创建客户演示文稿)
(二) 医疗健康与生命科学
为研究人员、临床医生和医疗开发者增强的技能包括:
- 生物信息学套件(scVI-tools和Nextflow部署技能,用于基因组学管道和单细胞RNA测序)
- 临床试验方案生成(加速临床研究方案开发)
- 科学问题选择(帮助研究人员识别和构建有影响力的研究问题)
- FHIR开发(帮助开发者编写更准确的健康数据互操作性代码)
- 预先授权审查(通过交叉引用覆盖要求、临床指南和患者记录,减轻行政负担)
标准化与生态建设
Anthropic正将Agent Skills发布为开放标准,如同MCP一样,旨在实现跨工具和平台的可移植性——同一技能应能在Claude和其他AI平台上工作。该标准已与生态系统成员合作开发,并开始获得早期采用。
愿景:当用户首次使用AI Agent时,它应已通过技能捕获并传递团队关心的知识。随着生态系统增长,社区构建的技能将使所有Agent更有用、更可靠、更有能力,无论使用哪个AI平台。
资源
- YouTube视频:Don’t Build Agents, Build Skills Instead
- 技能文档:平台文档
- GitHub仓库:anthropics/skills
- 技能指南:Skills cookbook
- 使用指南:在Claude中使用技能
- API快速入门:Skills API quickstart
- 最佳实践:技能最佳实践文档
更多推荐



所有评论(0)