引言

Anthropic 最近在官网发布了博客:Building agents with Skills: Equipping agents for specialized work,系统性地记录了Anthropic在Agent技术领域的创新突破,重点阐述从专用Agent到通用编码Agent的范式转变,并深入解析Agent Skills如何通过打包领域专业知识填补关键缺口,从而打造具备技能的智能体,让智能体胜任专业工作。接下来看看具体的内容。

年度进展概述

过去一年,Anthropic在Agent技术领域实现多项关键突破:

  • MCP成为Agent连接的行业标准,获得行业领导者和开发者社区的快速采用。
  • 推出Claude Code作为通用编码Agent。
  • 发布Claude Agent SDK,提供开箱即用的生产级Agent解决方案。

在构建和部署这些Agent的过程中,团队发现核心痛点:Agent具备智能和基础能力,但缺乏有效处理实际工作所需的专业知识。这一发现促使Anthropic开发Agent Skills(技能)——一种将领域专业知识(工作流、最佳实践、脚本)打包为Agent可访问和应用的文件集合,将通用Agent转化为专业领域专家。

范式转变:从专用Agent到通用编码Agent

(一) 传统模式:领域专用编码Agent

过去,不同领域的Agent被设计为独立系统,每个Agent都需要专用工具和架构支持。行业最初普遍采用这种领域特定Agent模型,例如独立的编码Agent、研究Agent、财务Agent和营销Agent,各自形成闭环系统。

领域专用编码Agent

(二) 新模式:通用编码Agent

随着模型智能和Agent能力的进步,Anthropic转向了不同的方法:代码不仅是一种用例,更是Agent执行几乎所有数字工作的接口。Claude Code作为编码Agent,同时也是通过代码工作的通用Agent,能够处理多种任务场景。

通用编码Agent

示例:使用Claude Code生成财务报告时,它可以通过代码调用API进行研究、在文件系统中存储数据、用Python进行分析,并综合生成洞察——所有操作都通过代码完成,架构简化为bash和文件系统。

关键缺口:领域专业知识

当前Agent如同数学天才:擅长在新情况下推理,但往往缺乏资深专业人士积累的专业知识。它们在适当指导下能完成出色工作,但常缺少重要上下文,难以吸收组织专业知识,也无法从重复任务中自动学习。

类比:报税选择——数学天才(从零开始推理)vs 经验丰富的税务专家(拥有数千次报税积累的专业知识)。技能通过打包领域专业知识填补这一缺口。

Agent Skills核心解析

(一) 定义与结构

技能是为Agent打包领域专业知识和过程知识的文件集合,典型结构如下:

anthropic_brand/
├── SKILL.md          # 核心技能文档
├── docs.md           # 补充文档
├── slide-decks.md    # 特定场景文档
└── apply_template.py # 可执行脚本工具

设计理念:文件是通用基础组件,可与现有工具(Git版本控制、Google Drive存储、团队共享)无缝协作,且技能创建不限于工程师,产品经理、分析师和领域专家均可参与。

(二) 渐进式披露机制

为保护上下文窗口并实现技能组合,技能采用三级渐进式披露策略:

  1. 元数据层:YAML前置元数据(名称和描述)始终在模型上下文中,仅占用约50 tokens。

    ---
    name: Anthropic Brand Style Guidelines
    description: Anthropic's official brand colors and typography…
    ---
    
    
  2. 核心文档层:当Claude确定需要某项技能时,才读取完整SKILL.md文件,约占用500 tokens。

  3. 参考文件层:支持文档存储在references/目录,仅在特定需要时加载,可包含2000+ tokens内容。

这一机制允许Agent配备数百项技能而不占用过多上下文窗口。

(三) 技能中的脚本工具

传统工具存在指令质量低、模型无法修改扩展、占用上下文窗口等问题。代码工具则具有自文档化、可修改、无需始终在上下文中等优势。

实例:Anthropic团队将重复使用的幻灯片样式应用脚本保存为工具:

# anthropic/brand_styling/apply_template.py
import sys
from pptx import Presentation

if len(sys.argv) != 2:
    print("USAGE: apply_template.py <pptx>")
    sys.exit(1)

prs = Presentation(sys.argv[1])
for slide in prs.slides:
    ...  # 应用品牌样式逻辑

对应文档中只需简单引用:Use the ./apply_template.py script to update a pptx file in-place.

技能生态系统

随着技能采用率增长,三大类技能正在形成:

技能类型 定义 实例
基础技能 提供所有人需要的核心能力 文档/电子表格/演示文稿处理,编码最佳实践 公共仓库基础技能
合作伙伴技能 公司为使服务可被Agent访问而构建 K-Dense科学技能、Browserbase浏览技能、Notion技能 技能目录
企业技能 组织编码内部流程和领域专业知识的专有技能 特定行业工作流、合规要求、机构知识库

技能发展趋势

(一) 技能复杂度提升

  • 简单技能:如"状态报告生成器"(约100行),包含模板和格式规范。
  • 中级技能:如"财务模型构建器"(约800行),包含数据检索、Python Excel建模功能。
  • 复杂技能:如"RNA测序管道"(2500+行),协调HISAT2、StringTie、DESeq2等专业分析工具。

(二) 技能与MCP服务器协同

技能与MCP服务器自然互补。例如,竞争分析技能可协调Web搜索、通过MCP访问内部数据库、Slack消息历史和Notion页面,综合生成全面报告。

(三) 非开发者采用

技能创建正从工程师扩展到产品经理、分析师和各领域专家。使用技能创建工具,非技术人员可在30分钟内创建并测试首个技能。Anthropic正通过改进工具和模板进一步降低创建门槛。

完整Agent架构

新兴Agent架构由四个核心组件构成:

  1. Agent循环:决定下一步行动的核心推理系统
  2. Agent运行时:执行环境(代码、文件系统)
  3. MCP服务器:连接外部工具和数据源
  4. 技能库:领域专业知识和过程知识

架构优势:各层职责明确(推理、执行、连接、指导),系统可理解性强,各组件可独立进化。

现代Agent架构

实例:添加前端设计技能后,Claude的前端能力立即提升,提供排版、色彩理论和动画方面的专业指导,且仅在构建Web界面时激活,通过渐进式披露机制仅在相关时加载。

垂直领域应用

这种"通用Agent+MCP服务器+技能"模式已帮助Claude拓展到新垂直领域:

(一) 金融服务

为金融专业人士增强的技能包括:

  • DCF模型构建器(含WACC计算和敏感性分析)
  • 可比公司分析(生成包含相关倍数和基准的比较表)
  • 收益分析(处理季度结果并创建投资更新报告)
  • 初始覆盖报告(构建带财务模型的综合研究报告)
  • 尽职调查(使用标准化框架构建并购分析)
  • 路演材料(遵循行业标准创建客户演示文稿)

(二) 医疗健康与生命科学

为研究人员、临床医生和医疗开发者增强的技能包括:

  • 生物信息学套件(scVI-tools和Nextflow部署技能,用于基因组学管道和单细胞RNA测序)
  • 临床试验方案生成(加速临床研究方案开发)
  • 科学问题选择(帮助研究人员识别和构建有影响力的研究问题)
  • FHIR开发(帮助开发者编写更准确的健康数据互操作性代码)
  • 预先授权审查(通过交叉引用覆盖要求、临床指南和患者记录,减轻行政负担)

标准化与生态建设

Anthropic正将Agent Skills发布为开放标准,如同MCP一样,旨在实现跨工具和平台的可移植性——同一技能应能在Claude和其他AI平台上工作。该标准已与生态系统成员合作开发,并开始获得早期采用。

愿景:当用户首次使用AI Agent时,它应已通过技能捕获并传递团队关心的知识。随着生态系统增长,社区构建的技能将使所有Agent更有用、更可靠、更有能力,无论使用哪个AI平台。

资源

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐