🎯 引言:Agent 的“高智商困境”

当前的 AI Agent 普遍面临一个悖论:

智商 300,专业度 0

就像 Anthropic 工程师 Barry Zhang 所比喻的:

“你希望谁帮你报税?是智商 300 的数学天才 Mahesh,还是经验丰富的税务专家 Barry?”

Agent 能写诗、能编程、能推理,但在特定领域任务(如财务建模、合规审查、临床试验分析)上,缺乏可持续、可复用、可验证的程序性专业知识。它记不住“上一次怎么做的”,也无法向“未来的自己”传承经验。

为破解这一困局,Anthropic 在 2025 年 10 月推出 Claude Skills —— 一种全新的 Agent 能力扩展范式,主张:

🛑 Stop Building Agents.
✅ Start Building Skills.

在这里插入图片描述


🧩 什么是 Skill?—— 文件夹即能力

Skill ≠ Function / Tool / Plugin

官方定义简洁而有力:

Skill = 一个带有指令、脚本与资源的文件夹
Claude 在需要时自动加载,使其具备完成某类专业任务的能力。

✅ Skill 的本质特征

特性 说明
文件系统原生 本质是普通文件夹,含 .py, .sh, skill.md, config.json 等,可直接 git add
可组合 & 可复用 多个 Skill 可并行加载;企业可构建内部 Skill 库
渐进式披露(Progressive Disclosure) Agent 初次只读 skill.md 元数据;调用时才加载完整内容 → 节省上下文
版本可控 支持 semver 语义化版本,便于灰度发布与回滚
非程序员友好 财务、法务、HR 也能用 Markdown + 模板创建领域 Skill

🌟 技术亮点:为何 Skill 是“下一代工具调用”?

传统 Function Calling(如 OpenAI Tool Calling)存在三大痛点:

问题 Skill 的解法
🔒 工具定义需硬编码进 prompt 技能自包含:工具脚本 + 使用文档 = 单一文件夹,Agent 按需加载
🧠 占用宝贵上下文窗口 仅元数据预加载skill.md 极简描述,完整逻辑延迟加载
🛠️ 无法修改/调试/测试 代码即工具:Agent 可读、写、改 Skill 中的脚本,实现“自我进化”

💡 举例:若让 Agent 多次为 PPT 加统一动画,传统方式每次重写脚本;而 Skill 允许它将脚本存入 ./skills/ppt-styler/,下次直接调用,结果一致、效率翻倍。


📦 Skill 的三大类型与生态

短短 5 周内,Skills 生态已形成清晰分层:

1️⃣ 基础技能(Foundational Skills)

→ 提供通用能力扩展

  • 文档技能:生成/编辑 Word、PPT、PDF
  • 编码技能:支持特定框架(如 PyTorch Lightning 模板生成)
  • 推理技能:形式化验证、逻辑链构建

2️⃣ 第三方技能(Third-Party Skills)

→ 由生态伙伴为自家产品构建

  • Browserbase + Stagehand:高可靠浏览器自动化
  • Notion Skills:理解用户工作区结构,跨页面搜索/聚合
  • Slack/Microsoft Teams Skills:自动归档会议纪要 → Jira ticket

3️⃣ 企业定制技能

→ 内部知识资产化

  • 财报分析模板(含合规校验逻辑)
  • 客户支持 SOP 脚本(含敏感词过滤)
  • 代码审查规则(集成 SonarQube 规则集)

📊 据披露:《财富》100 强中多家企业已将核心业务流程封装为 Skills,新员工 Agent 入职即具备“老员工经验”。


🏗️ 技术架构:Agent 的“操作系统”模型

Anthropic 提出全新 Agent 架构四层模型,Skill 位于核心应用层:

层级 类比 职责
Model CPU 提供原始推理能力(如 Claude 3.5)
Agent Runtime OS 管理文件系统、代码执行、上下文调度(Bash + FS + Python env)
MCP Servers 外设驱动 连接外部系统(数据库、API、搜索引擎)
Skills Library 应用软件 编码领域知识,决定 Agent “能不能做好某件事”

🔑 关键洞见:真正价值不在模型本身,而在模型之上构建的应用层


🧪 实战示例:构建一个「股票财报摘要」Skill

假设我们要让 Claude 自动读取上市公司 PDF 财报,提取关键指标并生成中文摘要。

步骤 1:创建 Skill 文件夹结构

skills/
└── stock-report-analyzer/
    ├── skill.md              # 元数据 & 使用说明
    ├── main.py               # 主逻辑(PDF 解析 + 摘要生成)
    ├── requirements.txt      # 依赖(pdfplumber, langchain, etc.)
    └── templates/
        └── summary_zh.jinja2 # 中文报告模板

skill.md

# 股票财报摘要分析器
**作者**:Finance Team  
**版本**:1.2.0  
**描述**:  
  从上市公司 PDF 财报中提取营收、净利润、毛利率等核心指标,  
  生成符合 SEC 规范的中文摘要报告。支持 A 股/H 股/美股。

**触发条件**:  
  - 用户提及“财报”、“年报”、“季报”、“financial report”  
  - 上传 .pdf 文件且文件名含 “annual” 或 “quarterly”

**输入**:  
  - `pdf_path: string` —— 财报 PDF 路径  
  - `lang: "zh" | "en" = "zh"` —— 输出语言

**输出**:  
  - 结构化 JSON + 渲染后的 Markdown 报告

步骤 2:Agent 自动调用(无需硬编码!)

用户上传 AAPL_2024_Q3.pdf 并提问:

“请用中文总结这份财报亮点。”

Claude:

  1. 扫描已加载 Skills,匹配到 stock-report-analyzer
  2. 读取 skill.md 确认适用性
  3. 调用 main.py --pdf AAPL_2024_Q3.pdf --lang zh
  4. 返回渲染报告 + 数据 JSON

全程无需修改 Agent 核心逻辑


🔮 未来:Skills 将开启 Agent 的“持续学习”时代

✅ 已实现

  • Skill Creator Skill:Claude 可自助创建新 Skill
  • Git 集成:团队协作开发 & CI/CD 测试
  • 非技术人员低代码构建(Notion 表单 → Skill)

🚧 规划中

方向 说明
Skill Testing Framework 单元测试 + 输出断言(如“毛利率必须为 0~1 之间”)
Skill Dependency Graph A Skill 依赖 B Skill,自动解析加载
Skill Marketplace 官方/社区共享平台(类似 npm for Agent)
Agent Memory → Skill 化 将成功经验自动沉淀为可复用 Skill

🌟 Barry 的愿景:
“Claude 在与用户合作的第 30 天,要比第 1 天更聪明。”
而 Skill,正是实现这一目标的最小可积累知识单元


📌 总结:为什么 Skills 是范式转移?

维度 传统 Agent Skill-Based Agent
能力构建 重写 Agent 新增 Skill 文件夹
知识沉淀 一次性 prompt 可版本化、可测试、可复用
协作门槛 工程师专属 产品/运营/领域专家均可参与
扩展成本 高(耦合逻辑) 极低(cp -r 即可复用)

🎯 最终隐喻:
模型是 CPU,Runtime 是 OS,而 Skill —— 是真正让用户愿意付费的“应用软件”


未来, 技能像软件一样:测试、评估、版本控制和依赖管理,Skills 就像应用软件,编码专业知识和独特视角,让 AI 真正“有用”

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐