一文搞懂 Agent Skills：从“会聊天”到“会干活”，Agent Skills 到底改变了什么？

Agent Skills 通常可以直译为“智能体技能”，是一种给智能体“加技能包/工作流插件”的标准化方式。从本质上看，它的作用类似于给 Agent 安装“技能包”或“工作流插件”——把完成某一类任务所需的知识步骤和工具使用方式整体封装起来，供 Agent 在合适的时机自动调用和执行，而不再依赖人类反复编写提示词来引导。如果将 Agent 理解为一个能够自主完成任务的“数字员工”，那么 Skill

风流少年

16人浏览 · 2026-02-03 10:34:04

风流少年 · 2026-02-03 10:34:04 发布

2025 年 10 月 16 日，Anthropic 正式发布了 Claude Skills，首次将 Skills 作为 Agent 的核心能力组件进行介绍；随后在 12 月 18 日，Anthropic 进一步将 Agent Skills 升级为一个跨平台的公开标准，打造了一个新的Agent的开发生态，此后OpenAI、Github、VS Code、Cursor 、Coze等纷纷跟进，在26年年初掀起了一波新的热潮。

一：Skills简介

1.1 Skills 是什么

Agent Skills 通常可以直译为“智能体技能”，是一种给智能体“加技能包/工作流插件”的标准化方式。从本质上看，它的作用类似于给 Agent 安装“技能包”或“工作流插件”——把完成某一类任务所需的知识、步骤和工具使用方式整体封装起来，供 Agent 在合适的时机自动调用和执行，而不再依赖人类反复编写提示词来引导。

如果将 Agent 理解为一个能够自主完成任务的“数字员工”，那么 Skills 就是它所掌握的具体“工种”或“手艺”。例如：查找并整理资料、制作表格、处理PDF、调用外部接口、制作并运行代码、生成结构化报告等等。这些原本需要多轮执行、反复调整的操作，都可以被固化为独立的 Skills，由 Agent 在任务过程中按需使用。

从实现层面来看，Skills 可以被理解为一种封装后的技能包，其内部通常包含：

针对某类任务设计好的 Prompt 逻辑
明确的执行流程
可能会用到的工具或脚本（如 API、代码、外部系统调用）

因此，Skills 并不是简单的一段提示词，而是一个将“怎么做一件事”工程化、模块化后的能力单元。

在这里插入图片描述

1.2 Skills 的构成

Agent Skills 以文件夹形式存在，官方协议中给出的 Agent Skills 形态里面包含：

SKILL.md：技能说明文件，包含指令 + 元数据（必要）， - 这个技能是什么、什么时候用、怎么用、输入输出是什么。
assets/：产出模板、配置文件、素材、示例资源（非必要）
examples/：背景知识、规范、标准、示例说明等（非必要）
scripts/：技能执行过程中可能调用的自动化脚本，例如 python 脚本（非必要）

在这里插入图片描述

1.3 Skills 的运作机制

在引入 Skill 之后，系统并不会简单地将整个 Skill 文件夹一次性塞进模型上下文中。而是采用「渐进式披露（Progressive Disclosure）」的机制高效管理上下文。将每一个skill 的相关信息按“曝光层级”进行拆分，模型在初次检索时只看到摘要，仅当确定要使用该技能时，才会加载具体的参数和操作手册。具体来看，通常会分为三个阶段：

在智能体启动或任务初始化阶段，模型仅会加载每个可用技能的名称和描述，这些信息足以让它们知道该技能何时可能相关。
当任务需求与某个 Skill 的描述高度匹配时，智能体才会进一步将该技能的完整说明：SKILL.md 读入上下文。这一阶段，模型开始了解该 Skill 的输入参数、使用约束以及执行方式。
在正式执行阶段，智能体会严格按照 Skill 中定义的流程与指令进行操作，并根据需要选择性加载补充材料（如参考文档）或运行随 Skill 捆绑的代码与脚本。

在这里插入图片描述

1.4 Skills 的优势

优势	说明
模块化与可组合性	每个 Skill 是一个独立模块，实现单一职责、清晰边界，可以组合使用。多个Skills 可以被 Agent 在一个任务中串联调用，形成复合工作流，例如从抓取数据到分析再生成报告的组合式应用。
知识与流程的工程化封装	Skill 不只是工具调用的合集，而是一整套"怎么做才稳妥"的步骤 + 模板 + 检查点 + 异常处理策略，相当于给 Agent 一个执行手册，使任务执行更可控。
渐进式披露减少上下文消耗	Skills 支持分层加载（metadata → 全说明 → 资源/脚本），避免一次性把所有细节塞入上下文，从而大幅减少初始的 token 消耗。
复用与共享能力	一个 Skill 写好之后可以多次复用、跨项目共享、团队或社区传播，形成组织或生态的"能力库"。Skill 本身自带说明文档（如 SKILL.md），用户和开发者都可以直接读懂其逻辑。
提升效率与稳定性	有了 Skill 之后，Agent 不再每次都从头重新理解与规划，而是可以通过调用既有实现过的能力模块来完成任务，这样流程更加稳定、预测性更强。重复性任务不再需要反复编写 Prompt，使得系统行为更加一致、可靠。
与现有 Agent 系统高度兼容	Skills 可以在不同平台（如 Claude、Codex 等）间动态加载，而无需修改底层模型结构，提高了与生态系统兼容性和扩展性。
支持跨任务与多领域应用	不同的 Skill 可以用于不同业务场景（如数据分析、文件处理、品牌规范应用等），让 Agent 在面对多变任务时更有"专家级"能力，而不是依赖通用推理。

二、大模型能力的系统化演进

2.1 从 Plugin 到 Agent Skills

大模型进化到Skills 并不是突然“学会了做事”，而是其能力被不断包装、约束并嵌入到系统中，才逐渐变得可用。从最早的API调用，到定制化Agent 再到Skills，这是一条从“模型能力”逐渐走向“系统能力”的演进路径。
在这里插入图片描述

2.2 MCP架构相关概念对比

形态	定义	典型例子	优点	缺点	主要解决了什么问题
Plugin（API）	一种让大模型通过提示词调用外部 API 或工具的机制 Plugin ≈ Prompt + Tool/API	搜索API、天气 API、数据库查询 API	- 模型首次能"做事" - 能访问实时信息和外部系统	- 强依赖 Prompt - 使用和组合成本高 - 行为不稳定	解决了模型无法接触现实世界的问题
GPTs（定制化模型）	将 Prompt、文件、工具和规则打包成一个可直接使用的定制模型实例	法律助手 GPT、数据分析 GPT	- 能力整体打包 - 降低使用门槛 - 行为相对稳定	- 仍然以对话为中心，不会主动行动 - 输入输出非结构化，难以嵌入自动化系统（输入输出的格式非常容易漂移）	解决了能力难以复用、难以稳定使用的问题
MCP（Model Context Protocol）	一种规范模型如何理解、发现和使用能力的上下文协议 MCP = 标准化上下文协议	深度研究 Agent、Genspark等多 Agent 协作平台	- 能力描述结构化 - 支持能力发现与选择 - 为多能力共存打基础	- 偏底层协议 - 对业务开发者不直观 - 本身不直接"做事"	解决了能力缺乏统一描述与调用规范的问题
Agent / A2A	能自主规划、拆解任务并调用工具或其他 Agent 的执行主体 Agent ≈ Skills + 规划 + MCP		- 能处理复杂任务 - 支持多步骤推理、自主规划 - 具备协作能力	- 成本高（不管是什么任务可能都要思考、规划、验证） - 行为不稳定（每次生成的内容不确定性太大）	解决了复杂任务需要自主规划执行的问题
Skills	将一类任务的知识、流程和工具封装成可被 Agent 调用的标准化能力模块 Skill ≈ Plugin + 任务流程 + 资源	文档解析 Skill、发邮件 Skill、UI设计 Skill	- 能力边界清晰 - 稳定、可复用、可组合 - 易于系统调度	- 前期设计成本较高	解决了Agent 执行不稳定、不可控、上下文消耗大的问题

三：Skills 使用体验

在开始使用 Claude Skill 之前，需要完成一定的前置环境准备，包括安装 Claude Code，并接入可用的国内模型 API（如智谱、Kimi 等）。完成相关配置后，只需打开终端并输入 claude，即可直接启动并使用 Claude Code。

在这里插入图片描述

1. 手动开发

Claude 支持以“手动开发”的方式从零构建一个 Skill。一个 Skill 的核心在于其 SKILL.md 文件，Claude 官方明确要求了该文件由两部分组成：数据 + 说明文档。

在这里插入图片描述
在文件顶部，是采用 YAML frontmatter 形式编写的元数据，用于向系统描述这个 Skill 的基本属性，包括：

name：Skill 的名称（必要）
description：该 Skill 的功能说明及适用场景（必要）
allowed-tools：在该 Skill 执行过程中允许自动调用的工具
model：默认使用的模型
context：是否在独立的子 Agent 上下文中运行

在文件底部，是 Markdown 形式的说明文档，用于明确告知 Claude：这个 Skill 应该如何被理解、在什么情况下被触发，以及具体的执行方式和注意事项。这一部分本质上是对任务流程和使用规范的显式约束，也是 Skill 能否稳定生效的关键。

手动编写并接入了两个 Skill，分别用于文章润色和爬取外部资讯总结。从使用效果来看，这两个 Skill 都能够被 Claude 正确识别和调用。

当输入具体 case 后，系统会先自动判断当前 query 是否匹配已有 Skill，并弹出提示询问是否启用；
在确认后，Skill 会按照既定流程自动执行，整体效果符合预期，稳定性和可控性也明显优于单纯依赖 Prompt 的方式。

2. 导入已有skill

目前在 GitHub 上已经有不少开发者上传并分享了自己创作的 Skill，我们可以直接下载这些现成的 Skill 并在本地使用。导入方式相对简单：只需将下载后的 Skill 文件夹放入 Claude 的 Skill 目录中，即可完成加载并开始使用。

Claude官方Skill库：https://github.com/anthropics/skills
Skill库社区：https://skillsmp.com/

结合工作需要，导入了一个用于 UI / UX 设计的 Skill，这是一个围绕 UI 设计与产品体验构建的综合型 Skill，本质上是一个结构化的设计知识与最佳实践搜索数据库，覆盖了从视觉风格到技术实现的多个层面，目前热度很高。
GitHub 地址：https://github.com/nextlevelbuilder/ui-ux-pro-max-skill

任务开始执行后，并不会直接进入生成阶段，Claude Code 会先通过一系列结构化的反问来澄清需求背景与设计约束，在信息足够完整后，再统一触发Skill 进行后续的设计生成流程。
从最终效果来看，生成网页在整体视觉风格与布局设计上，相较于未使用 Skill 的情况下有了明显提升。无论是字体样式的选择、图标体系的丰富度，还是页面模块的组织方式，都更加成熟且具有设计感，整体结构也更为完整，基本达到了可以直接参考，甚至具备实际落地使用价值的水平。

四：一些好用的Skill推荐

名称	说明	链接
视频转Gif	支持将视频文件直接转换为10M以内的Gif的文件	https://www.coze.cn/?skill_share_pid=7597348147404357672
ui-ux-pro-max	内置包含57种UI 风格、95个色彩搭配方案、56 种字体组合、24 个图表类型、10个技术栈，98个UX 设计规范，适用于各种demo开发的ui设计	https://github.com/nextlevelbuilder/ui-ux-pro-max-skill
Skill Creator	Anthropic官方打造的核心元技能，它通过对话式引导的方式，帮助用户快速创建自定义Skills，自动生成符合官方规范的SKILL.md文件及技能文件夹结构。	https://github.com/anthropics/skills/tree/main/skills/skill-creator
文档四件套-Docx	全面的Word文档创建、编辑和分析工具，支持跟踪更改、注释、格式化保留和文本提取。	https://github.com/anthropics/skills/tree/main/skills/docx
文档四件套-PPT	演示文稿创建、编辑和分析工具，支持从设计到实现的完整工作流。	https://github.com/anthropics/skills/tree/main/skills/pptx
文档四件套-PDF	全面的PDF处理工具包，用于提取文本和表格、创建新PDF、合并/拆分文档等。	https://github.com/anthropics/skills/tree/main/skills/pdf
文档四件套-Excel	全面的电子表格创建、编辑和分析工具，支持公式、格式化、数据分析和可视化。	https://github.com/anthropics/skills/tree/main/skills/xlsx

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Spring AI框架全方位详解

2048 AI社区

全栈信创融合AI 打造自主可控的智能算力底座

算力兴则数字兴，算力强则数字强。全栈信创筑牢自主可控之基，AI激活智能算力之核，二者的深度融合，不仅破解了我国算力产业的“卡脖子”困境，更重构了智能算力体系的发展范式，为千行百业数字化转型注入硬核动力。站在新的发展起点，产业链各方需携手同心、协同发力，持续加大技术研发投入，推动融合应用落地，完善产业生态体系，以全栈信创融合AI之力，打造全球领先的自主可控智能算力底座，为我国科技自立自强、数字经济高