一文搞懂 Agent Skills:从“会聊天”到“会干活”,Agent Skills 到底改变了什么?
Agent Skills 通常可以直译为“智能体技能”,是一种给智能体“加技能包/工作流插件”的标准化方式。从本质上看,它的作用类似于给 Agent 安装“技能包”或“工作流插件”——把完成某一类任务所需的知识步骤和工具使用方式整体封装起来,供 Agent 在合适的时机自动调用和执行,而不再依赖人类反复编写提示词来引导。如果将 Agent 理解为一个能够自主完成任务的“数字员工”,那么 Skill
2025 年 10 月 16 日,Anthropic 正式发布了 Claude Skills,首次将 Skills 作为 Agent 的核心能力组件进行介绍;随后在 12 月 18 日,Anthropic 进一步将 Agent Skills 升级为一个跨平台的公开标准,打造了一个新的Agent的开发生态,此后OpenAI、Github、VS Code、Cursor 、Coze等纷纷跟进,在26年年初掀起了一波新的热潮。
一:Skills简介
1.1 Skills 是什么
Agent Skills 通常可以直译为“智能体技能”,是一种给智能体“加技能包/工作流插件”的标准化方式。从本质上看,它的作用类似于给 Agent 安装“技能包”或“工作流插件”——把完成某一类任务所需的知识、步骤和工具使用方式整体封装起来,供 Agent 在合适的时机自动调用和执行,而不再依赖人类反复编写提示词来引导。
如果将 Agent 理解为一个能够自主完成任务的“数字员工”,那么 Skills 就是它所掌握的具体“工种”或“手艺”。例如:查找并整理资料、制作表格、处理PDF、调用外部接口、制作并运行代码、生成结构化报告等等。这些原本需要多轮执行、反复调整的操作,都可以被固化为独立的 Skills,由 Agent 在任务过程中按需使用。
从实现层面来看,Skills 可以被理解为一种封装后的技能包,其内部通常包含:
- 针对某类任务设计好的 Prompt 逻辑
- 明确的执行流程
- 可能会用到的工具或脚本(如 API、代码、外部系统调用)
因此,Skills 并不是简单的一段提示词,而是一个将“怎么做一件事”工程化、模块化后的能力单元。

1.2 Skills 的构成
Agent Skills 以文件夹形式存在,官方协议中给出的 Agent Skills 形态里面包含:
- SKILL.md:技能说明文件,包含指令 + 元数据(必要), - 这个技能是什么、什么时候用、怎么用、输入输出是什么。
- assets/:产出模板、配置文件、素材、示例资源(非必要)
- examples/:背景知识、规范、标准、示例说明等(非必要)
- scripts/:技能执行过程中可能调用的自动化脚本,例如 python 脚本(非必要)

1.3 Skills 的运作机制
在引入 Skill 之后,系统并不会简单地将整个 Skill 文件夹一次性塞进模型上下文中。而是采用「渐进式披露(Progressive Disclosure)」的机制高效管理上下文。将每一个skill 的相关信息按“曝光层级”进行拆分,模型在初次检索时只看到摘要,仅当确定要使用该技能时,才会加载具体的参数和操作手册。具体来看,通常会分为三个阶段:
- 在智能体启动或任务初始化阶段,模型仅会加载每个可用技能的名称和描述,这些信息足以让它们知道该技能何时可能相关。
- 当任务需求与某个 Skill 的描述高度匹配时,智能体才会进一步将该技能的完整说明:SKILL.md 读入上下文。这一阶段,模型开始了解该 Skill 的输入参数、使用约束以及执行方式。
- 在正式执行阶段,智能体会严格按照 Skill 中定义的流程与指令进行操作,并根据需要选择性加载补充材料(如参考文档)或运行随 Skill 捆绑的代码与脚本。

1.4 Skills 的优势
| 优势 | 说明 |
|---|---|
| 模块化与可组合性 | 每个 Skill 是一个独立模块,实现单一职责、清晰边界,可以组合使用。多个Skills 可以被 Agent 在一个任务中串联调用,形成复合工作流,例如从抓取数据到分析再生成报告的组合式应用。 |
| 知识与流程的工程化封装 | Skill 不只是工具调用的合集,而是一整套"怎么做才稳妥"的步骤 + 模板 + 检查点 + 异常处理策略,相当于给 Agent 一个执行手册,使任务执行更可控。 |
| 渐进式披露减少上下文消耗 | Skills 支持分层加载(metadata → 全说明 → 资源/脚本),避免一次性把所有细节塞入上下文,从而大幅减少初始的 token 消耗。 |
| 复用与共享能力 | 一个 Skill 写好之后可以多次复用、跨项目共享、团队或社区传播,形成组织或生态的"能力库"。Skill 本身自带说明文档(如 SKILL.md),用户和开发者都可以直接读懂其逻辑。 |
| 提升效率与稳定性 | 有了 Skill 之后,Agent 不再每次都从头重新理解与规划,而是可以通过调用既有实现过的能力模块来完成任务,这样流程更加稳定、预测性更强。重复性任务不再需要反复编写 Prompt,使得系统行为更加一致、可靠。 |
| 与现有 Agent 系统高度兼容 | Skills 可以在不同平台(如 Claude、Codex 等)间动态加载,而无需修改底层模型结构,提高了与生态系统兼容性和扩展性。 |
| 支持跨任务与多领域应用 | 不同的 Skill 可以用于不同业务场景(如数据分析、文件处理、品牌规范应用等),让 Agent 在面对多变任务时更有"专家级"能力,而不是依赖通用推理。 |
二、大模型能力的系统化演进
2.1 从 Plugin 到 Agent Skills
大模型进化到Skills 并不是突然“学会了做事”,而是其能力被不断包装、约束并嵌入到系统中,才逐渐变得可用。从最早的API调用,到定制化Agent 再到Skills,这是一条从“模型能力”逐渐走向“系统能力”的演进路径。
2.2 MCP架构相关概念对比
| 形态 | 定义 | 典型例子 | 优点 | 缺点 | 主要解决了什么问题 |
|---|---|---|---|---|---|
| Plugin(API) | 一种让大模型通过提示词调用外部 API 或工具的机制 Plugin ≈ Prompt + Tool/API | 搜索API、天气 API、数据库查询 API | - 模型首次能"做事" - 能访问实时信息和外部系统 | - 强依赖 Prompt - 使用和组合成本高 - 行为不稳定 | 解决了模型无法接触现实世界的问题 |
| GPTs(定制化模型) | 将 Prompt、文件、工具和规则打包成一个可直接使用的定制模型实例 | 法律助手 GPT、数据分析 GPT | - 能力整体打包 - 降低使用门槛 - 行为相对稳定 | - 仍然以对话为中心,不会主动行动 - 输入输出非结构化,难以嵌入自动化系统(输入输出的格式非常容易漂移) | 解决了能力难以复用、难以稳定使用的问题 |
| MCP(Model Context Protocol) | 一种规范模型如何理解、发现和使用能力的上下文协议 MCP = 标准化上下文协议 | 深度研究 Agent、Genspark等多 Agent 协作平台 | - 能力描述结构化 - 支持能力发现与选择 - 为多能力共存打基础 | - 偏底层协议 - 对业务开发者不直观 - 本身不直接"做事" | 解决了能力缺乏统一描述与调用规范的问题 |
| Agent / A2A | 能自主规划、拆解任务并调用工具或其他 Agent 的执行主体 Agent ≈ Skills + 规划 + MCP | - 能处理复杂任务 - 支持多步骤推理、自主规划 - 具备协作能力 | - 成本高(不管是什么任务可能都要思考、规划、验证) - 行为不稳定(每次生成的内容不确定性太大) | 解决了复杂任务需要自主规划执行的问题 | |
| Skills | 将一类任务的知识、流程和工具封装成可被 Agent 调用的标准化能力模块 Skill ≈ Plugin + 任务流程 + 资源 | 文档解析 Skill、发邮件 Skill、UI设计 Skill | - 能力边界清晰 - 稳定、可复用、可组合 - 易于系统调度 | - 前期设计成本较高 | 解决了Agent 执行不稳定、不可控、上下文消耗大的问题 |
三:Skills 使用体验
在开始使用 Claude Skill 之前,需要完成一定的前置环境准备,包括安装 Claude Code,并接入可用的国内模型 API(如智谱、Kimi 等)。完成相关配置后,只需打开终端并输入 claude,即可直接启动并使用 Claude Code。

1. 手动开发
Claude 支持以“手动开发”的方式从零构建一个 Skill。一个 Skill 的核心在于其 SKILL.md 文件,Claude 官方明确要求了该文件由两部分组成:数据 + 说明文档。

在文件顶部,是采用 YAML frontmatter 形式编写的元数据,用于向系统描述这个 Skill 的基本属性,包括:
- name:Skill 的名称(必要)
- description:该 Skill 的功能说明及适用场景(必要)
- allowed-tools:在该 Skill 执行过程中允许自动调用的工具
- model:默认使用的模型
- context:是否在独立的子 Agent 上下文中运行
在文件底部,是 Markdown 形式的说明文档,用于明确告知 Claude:这个 Skill 应该如何被理解、在什么情况下被触发,以及具体的执行方式和注意事项。这一部分本质上是对任务流程和使用规范的显式约束,也是 Skill 能否稳定生效的关键。
手动编写并接入了两个 Skill,分别用于文章润色和爬取外部资讯总结。从使用效果来看,这两个 Skill 都能够被 Claude 正确识别和调用。
- 当输入具体 case 后,系统会先自动判断当前 query 是否匹配已有 Skill,并弹出提示询问是否启用;
- 在确认后,Skill 会按照既定流程自动执行,整体效果符合预期,稳定性和可控性也明显优于单纯依赖 Prompt 的方式。
2. 导入已有skill
目前在 GitHub 上已经有不少开发者上传并分享了自己创作的 Skill,我们可以直接下载这些现成的 Skill 并在本地使用。导入方式相对简单:只需将下载后的 Skill 文件夹放入 Claude 的 Skill 目录中,即可完成加载并开始使用。
- Claude官方Skill库:https://github.com/anthropics/skills
- Skill库社区:https://skillsmp.com/
结合工作需要,导入了一个用于 UI / UX 设计的 Skill,这是一个围绕 UI 设计与产品体验构建的综合型 Skill,本质上是一个结构化的设计知识与最佳实践搜索数据库,覆盖了从视觉风格到技术实现的多个层面,目前热度很高。
GitHub 地址:https://github.com/nextlevelbuilder/ui-ux-pro-max-skill
- 任务开始执行后,并不会直接进入生成阶段,Claude Code 会先通过一系列结构化的反问来澄清需求背景与设计约束,在信息足够完整后,再统一触发Skill 进行后续的设计生成流程。
- 从最终效果来看,生成网页在整体视觉风格与布局设计上,相较于未使用 Skill 的情况下有了明显提升。无论是字体样式的选择、图标体系的丰富度,还是页面模块的组织方式,都更加成熟且具有设计感,整体结构也更为完整,基本达到了可以直接参考,甚至具备实际落地使用价值的水平。
四:一些好用的Skill推荐
| 名称 | 说明 | 链接 |
|---|---|---|
| 视频转Gif | 支持将视频文件直接转换为10M以内的Gif的文件 | https://www.coze.cn/?skill_share_pid=7597348147404357672 |
| ui-ux-pro-max | 内置包含57种UI 风格、95个色彩搭配方案、56 种字体组合、24 个图表类型、10个技术栈,98个UX 设计规范,适用于各种demo开发的ui设计 | https://github.com/nextlevelbuilder/ui-ux-pro-max-skill |
| Skill Creator | Anthropic官方打造的核心元技能,它通过对话式引导的方式,帮助用户快速创建自定义Skills,自动生成符合官方规范的SKILL.md文件及技能文件夹结构。 | https://github.com/anthropics/skills/tree/main/skills/skill-creator |
| 文档四件套-Docx | 全面的Word文档创建、编辑和分析工具,支持跟踪更改、注释、格式化保留和文本提取。 | https://github.com/anthropics/skills/tree/main/skills/docx |
| 文档四件套-PPT | 演示文稿创建、编辑和分析工具,支持从设计到实现的完整工作流。 | https://github.com/anthropics/skills/tree/main/skills/pptx |
| 文档四件套-PDF | 全面的PDF处理工具包,用于提取文本和表格、创建新PDF、合并/拆分文档等。 | https://github.com/anthropics/skills/tree/main/skills/pdf |
| 文档四件套-Excel | 全面的电子表格创建、编辑和分析工具,支持公式、格式化、数据分析和可视化。 | https://github.com/anthropics/skills/tree/main/skills/xlsx |
更多推荐


所有评论(0)