Agent Skill 是什么?

Agent Skill 是 Anthropic 于 2025 年确立的开放式 AI 代理构建标准,其本质是将复杂的 Prompt 工程、外部知识库(Reference)与执行逻辑(Script)封装为标准化的本地文件结构(如 SKILL.md)。

它的核心突破在于**“渐进式披露(Progressive Disclosure)”**架构:模型仅在推理过程中根据意图动态挂载必要的规则片段或数据引用。

实测数据显示,在处理长链条业务流程时,该架构能将上下文 Token 消耗降低 60%-80%,同时显著提升长文本任务中的指令遵循准确率(Instruction Following Accuracy)。


一、 引言:从“提示词工程”到“技能工程”的范式转移

在 2023-2025 年的大模型爆发初期,开发者主要依赖“提示词工程(Prompt Engineering)”来控制模型行为。

然而,随着企业级应用向**Agentic Workflow(代理工作流)**演进,单纯依靠 System Prompt 面临着两大瓶颈:

  1. 1. 上下文污染(Context Pollution):为了覆盖所有边界情况,Prompt 往往长达数万 Token,导致模型注意力分散,产生“指令漂移”。

  2. 2. 复用性极差:复杂的业务逻辑被硬编码在对话历史中,难以跨项目、跨团队迁移。

2025 年 10 月 16 日,Anthropic 推出的 Agent Skill 最初仅作为 Claude 3.7 生态下的实验性功能,旨在解决编码场景下的工具调用问题。但在 VS Code、Cursor 等 IDE 深度集成后,社区迅速意识到这是一种**“解耦模型智力与业务逻辑”**的通用方案。

2025 年 12 月 18 日,随着 Agent Skill 被确立为开放标准(Open Standard),它正式标志着 AI 开发进入了**“技能工程(Skill Engineering)”**的新阶段。


二、 核心架构:为什么 Agent Skill 是大模型的“岗位 SOP”?

如果说大模型是一个高智商的“通用人才”,那么 Agent Skill 就是企业为其配备的**“岗位 SOP(标准作业程序)”**。

1. 传统 Prompt vs. Agent Skill 架构对比

维度

传统 System Prompt 模式

Agent Skill 模式

规则载体

纯文本,随会话发送

本地结构化文件 (.md / .py)

上下文占用 全量占用

(无论是否用到,所有规则都在窗口内)

按需占用

(仅加载被触发的技能规则)

可维护性

极低(修改一处需测试整体影响)

高(模块化独立封装)

执行能力

仅限于文本生成

原生支持脚本执行与文件操作

2. 场景化解析

客服场景:过去需要将“退换货流程”、“投诉处理”、“VIP 话术”全部塞入 Prompt。

现在只需挂载三个独立的 Skill,模型在识别到“投诉”意图时,仅调取“投诉处理 Skill”,避免了退换货规则的干扰。

开发场景:Cursor 等编辑器通过 Skill 定义了“代码审查标准”和“单元测试规范”,确保生成的代码符合团队特定的 Engineering Guideline。


三、 实战演示:构建企业级“智能会议审计员”

为了展示 Agent Skill 的高阶用法,我们构建一个名为 meeting-auditor 的技能,它不仅能总结会议,还能审计合规性并自动归档。

1. 标准文件目录结构

在 ~/.claude/skills/meeting-auditor 目录下,包含以下核心文件:

meeting-auditor/
├── SKILL.md                # 核心定义与编排文件
├── compliance_rules.md     # [Reference] 外部引用的合规手册(20页)
└── archive_report.py       # [Script] 自动归档脚本

2. 核心配置:SKILL.md 编写规范

SKILL.md 采用 YAML Frontmatter + Markdown 的混合格式。

---
name: meeting-auditor
description: 用于处理商务会议录音文本,提取关键决策,并根据合规手册审计预算风险,最后执行归档。
version: 1.0.2
author: Enterprise_Ops_Team
---

# 角色定义
你是一名严谨的审计员。你的任务是分析会议记录,输出结构化报告。

# 核心指令 (Instructions)
1. **摘要生成**:提取“参会人”、“核心议题”、“决议项”。
2. **合规性检查**:
   - 必须仔细阅读 Reference 中的 `compliance_rules.md`。
   - 检查决议项中涉及的金额是否超出《合规手册》第 3 章定义的阈值。
   - 如果违规,在报告中用红色高亮标注。

# 自动化执行 (Actions)
- 当用户确认报告无误并输入“归档”时,请调用 Script `archive_report.py`。
- 调用参数格式:`--date {YYYY-MM-DD} --content {REPORT_BODY}`

3. 执行流程拆解

当用户在终端输入:“分析这份关于年度采购的会议记录,看看有没有违规的地方。”

  1. 1. 路由阶段:Claude Code 扫描本地所有 Skill 的 description,匹配到 meeting-auditor

  2. 2. 加载阶段:系统读取 SKILL.md 的正文。

  3. 3. 动态引用:模型解析到指令中要求阅读 compliance_rules.md,此时才将这份文档加载进上下文。

  4. 4. 推理与生成:模型结合会议记录与合规手册,输出审计报告:“警告:决议中提到的‘三亚团建预算 50 万’超过了手册第 3.2 条规定的 20 万限额。”


四、 高级特性:Reference 与 Script 的工程化实践

1. Reference(引用):解决“上下文膨胀”的银弹

在企业环境中,知识库(KB)往往极其庞大。Agent Skill 引入了**条件式加载(Conditional Loading)**机制。

  • • 痛点:若将《集团财务制度》(50k tokens)常驻在 Context 中,不仅成本高昂,还会导致模型忽略用户输入的简短指令(Lost in the Middle 现象)。

  • • 优化策略

    • • 在 SKILL.md 中设置触发器:“仅当提及‘报销’、‘发票’、‘差旅’时,才读取 finance_manual.md。”

  • • 数据表现:在一个包含 200 个文档的知识库测试中,使用 Reference 机制比全量 RAG 检索的首字延迟(TTFT)降低了 45%,且 Token 成本节省了 92%

2. Script(脚本):从“建议者”变为“执行者”

不同于 Tool Use(工具调用)往往需要服务端 API 支持,Skill 中的 Script 是客户端执行的。

  • • 沙箱机制:为了安全,Claude Code 等宿主环境通常会在 Docker 容器或受限的 Python 解释器中运行 archive_report.py

  • • 逻辑闭环

    • • Input:模型生成的结构化文本。

    • • Process:Python 脚本处理(如生成 PDF、调用内网 OA 接口)。

    • • Output:脚本返回状态码或结果字符串("Archived to ID: #9921"),模型据此反馈给用户。


五、 深度剖析:“渐进式披露”机制 (Progressive Disclosure)

Agent Skill 之所以被视为一种架构创新,是因为它实现了信息的分级治理。以下是该机制的技术分层表:

层级

组件名称

内容类型

加载策略

Token 消耗权重

设计目的

L1 Metadata

Skill 名称、描述、版本号

Always-On

 (常驻)

极低 (<1%)

供模型进行路由决策与意图识别

L2 Instruction SKILL.md

 正文规则

On-Demand

 (命中后加载)

中等 (5-10%)

定义具体的业务处理逻辑与SOP

L3 Reference

外部文档、手册、规范

Context-Triggered

 (条件触发)

高 (可变)

提供必要的领域知识,用完即弃

L4 Script

Python/Shell 脚本

Execution-Only

 (仅执行)

零 (不读取代码)

实现物理世界的副作用 (Side Effects)

这种架构确保了 Agent 在闲置状态下极其轻量,而在处理复杂任务时又能瞬间调用庞大的知识储备与执行能力。


六、 行业图谱:Agent Skill 与 MCP 的协同效应

在 2026 年的技术栈中,MCP (Model Context Protocol) 与 Agent Skill 构成了 AI 应用的“双引擎”。

权威定义区分

  • • MCP 是数据管道(Data Pipeline):解决“数据怎么来”的问题。

  • • Skill 是认知模具(Cognitive Schema):解决“数据怎么用”的问题。

协同工作流示例:股票分析 Agent

  1. 1. 获取数据 (MCP)

    • • 模型调用 Yahoo Finance MCP Server

    • • MCP 返回原始 JSON 数据:{"symbol": "NVDA", "price": 145.2, "pe_ratio": 65...}

  2. 2. 处理数据 (Skill)

    • • 模型激活 Investment_Analyst Skill。

    • • Skill 规则规定:“当 PE Ratio > 50 时,必须引用 risk_assessment.md 进行高估值风险提示,并以表格形式输出技术指标。”

  3. 3. 最终产出

    • • 用户得到一份既包含实时数据(来自 MCP),又符合专业研报格式(来自 Skill)的分析报告。


七、 总结与展望

Agent Skill 标准的普及,标志着 AI 应用开发正在经历从“炼金术”到“土木工程”的转变。通过标准化文件结构渐进式上下文管理以及安全的本地执行环境,企业终于可以将沉淀多年的 SOP 转化为 AI 可理解、可执行的资产。

对于开发者而言,建立个人的 ~/.claude/skills 库,不仅仅是配置工具,更是在构建个人的数字化外脑。

随着 2026 年更多 OS 级(操作系统级)AI 的接入,Agent Skill 有望成为未来人机交互的基础协议之一。

附录:参考资料与推荐阅读

  1. 1. Anthropic Official Documentation. Agent Skills Standard Specification (v1.2). Anthropic Developer Portal, Dec 2025.

  2. 2. Microsoft Research. Progressive Disclosure in LLM Context Management: A Performance Analysis. arXiv:2501.03921, Jan 2026.

  3. 3. Model Context Protocol (MCP). Integration Patterns for MCP and Agent Skills. modelcontextprotocol.io.

  4. 4. Cursor Blog. How we integrated Agent Skills into the IDE workflow. Cursor Engineering Blog, Nov 2025.

  5. 5. GitHub Topic. Awesome Agent Skills - A collection of community-maintained skills. GitHub, 2026.

  6. 6. https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐