2025 年 10 月 16 日,Anthropic 正式发布了 Claude Skills,首次将 Skills 作为 Agent 的核心能力组件进行介绍;随后在 12 月 18 日,Anthropic 进一步将 Agent Skills 升级为一个跨平台的公开标准,打造了一个新的Agent的开发生态,此后OpenAI、Github、VS Code、Cursor 、Coze等纷纷跟进,在26年年初掀起了一波新的热潮。

一:Skills简介

1.1 Skills 是什么

Agent Skills 通常可以直译为“智能体技能”,是一种给智能体“加技能包/工作流插件”的标准化方式。从本质上看,它的作用类似于给 Agent 安装“技能包”或“工作流插件”——把完成某一类任务所需的知识步骤工具使用方式整体封装起来,供 Agent 在合适的时机自动调用和执行,而不再依赖人类反复编写提示词来引导。

如果将 Agent 理解为一个能够自主完成任务的“数字员工”,那么 Skills 就是它所掌握的具体“工种”或“手艺”。例如:查找并整理资料、制作表格、处理PDF、调用外部接口、制作并运行代码、生成结构化报告等等。这些原本需要多轮执行、反复调整的操作,都可以被固化为独立的 Skills,由 Agent 在任务过程中按需使用。

从实现层面来看,Skills 可以被理解为一种封装后的技能包,其内部通常包含:

  • 针对某类任务设计好的 Prompt 逻辑
  • 明确的执行流程
  • 可能会用到的工具或脚本(如 API、代码、外部系统调用)

因此,Skills 并不是简单的一段提示词,而是一个将“怎么做一件事”工程化、模块化后的能力单元。

在这里插入图片描述

1.2 Skills 的构成

Agent Skills 以文件夹形式存在,官方协议中给出的 Agent Skills 形态里面包含:

  • SKILL.md:技能说明文件,包含指令 + 元数据(必要), - 这个技能是什么、什么时候用、怎么用、输入输出是什么。
  • assets/:产出模板、配置文件、素材、示例资源(非必要)
  • examples/:背景知识、规范、标准、示例说明等(非必要)
  • scripts/:技能执行过程中可能调用的自动化脚本,例如 python 脚本(非必要)

在这里插入图片描述

1.3 Skills 的运作机制

在引入 Skill 之后,系统并不会简单地将整个 Skill 文件夹一次性塞进模型上下文中。而是采用「渐进式披露(Progressive Disclosure)」的机制高效管理上下文。将每一个skill 的相关信息按“曝光层级”进行拆分,模型在初次检索时只看到摘要,仅当确定要使用该技能时,才会加载具体的参数和操作手册。具体来看,通常会分为三个阶段:

  • 在智能体启动或任务初始化阶段,模型仅会加载每个可用技能的名称和描述,这些信息足以让它们知道该技能何时可能相关。
  • 当任务需求与某个 Skill 的描述高度匹配时,智能体才会进一步将该技能的完整说明:SKILL.md 读入上下文。这一阶段,模型开始了解该 Skill 的输入参数、使用约束以及执行方式。
  • 在正式执行阶段,智能体会严格按照 Skill 中定义的流程与指令进行操作,并根据需要选择性加载补充材料(如参考文档)或运行随 Skill 捆绑的代码与脚本。

在这里插入图片描述

1.4 Skills 的优势

优势 说明
模块化与可组合性 每个 Skill 是一个独立模块,实现单一职责、清晰边界,可以组合使用。多个Skills 可以被 Agent 在一个任务中串联调用,形成复合工作流,例如从抓取数据到分析再生成报告的组合式应用。
知识与流程的工程化封装 Skill 不只是工具调用的合集,而是一整套"怎么做才稳妥"的步骤 + 模板 + 检查点 + 异常处理策略,相当于给 Agent 一个执行手册,使任务执行更可控。
渐进式披露减少上下文消耗 Skills 支持分层加载(metadata → 全说明 → 资源/脚本),避免一次性把所有细节塞入上下文,从而大幅减少初始的 token 消耗。
复用与共享能力 一个 Skill 写好之后可以多次复用、跨项目共享、团队或社区传播,形成组织或生态的"能力库"。Skill 本身自带说明文档(如 SKILL.md),用户和开发者都可以直接读懂其逻辑。
提升效率与稳定性 有了 Skill 之后,Agent 不再每次都从头重新理解与规划,而是可以通过调用既有实现过的能力模块来完成任务,这样流程更加稳定、预测性更强。重复性任务不再需要反复编写 Prompt,使得系统行为更加一致、可靠。
与现有 Agent 系统高度兼容 Skills 可以在不同平台(如 Claude、Codex 等)间动态加载,而无需修改底层模型结构,提高了与生态系统兼容性和扩展性。
支持跨任务与多领域应用 不同的 Skill 可以用于不同业务场景(如数据分析、文件处理、品牌规范应用等),让 Agent 在面对多变任务时更有"专家级"能力,而不是依赖通用推理。

二、大模型能力的系统化演进

2.1 从 Plugin 到 Agent Skills

大模型进化到Skills 并不是突然“学会了做事”,而是其能力被不断包装、约束并嵌入到系统中,才逐渐变得可用。从最早的API调用,到定制化Agent 再到Skills,这是一条从“模型能力”逐渐走向“系统能力”的演进路径。
在这里插入图片描述

2.2 MCP架构相关概念对比

形态 定义 典型例子 优点 缺点 主要解决了什么问题
Plugin(API) 一种让大模型通过提示词调用外部 API 或工具的机制 Plugin ≈ Prompt + Tool/API 搜索API、天气 API、数据库查询 API - 模型首次能"做事" - 能访问实时信息和外部系统 - 强依赖 Prompt - 使用和组合成本高 - 行为不稳定 解决了模型无法接触现实世界的问题
GPTs(定制化模型) 将 Prompt、文件、工具和规则打包成一个可直接使用的定制模型实例 法律助手 GPT、数据分析 GPT - 能力整体打包 - 降低使用门槛 - 行为相对稳定 - 仍然以对话为中心,不会主动行动 - 输入输出非结构化,难以嵌入自动化系统(输入输出的格式非常容易漂移) 解决了能力难以复用、难以稳定使用的问题
MCP(Model Context Protocol) 一种规范模型如何理解、发现和使用能力的上下文协议 MCP = 标准化上下文协议 深度研究 Agent、Genspark等多 Agent 协作平台 - 能力描述结构化 - 支持能力发现与选择 - 为多能力共存打基础 - 偏底层协议 - 对业务开发者不直观 - 本身不直接"做事" 解决了能力缺乏统一描述与调用规范的问题
Agent / A2A 能自主规划、拆解任务并调用工具或其他 Agent 的执行主体 Agent ≈ Skills + 规划 + MCP - 能处理复杂任务 - 支持多步骤推理、自主规划 - 具备协作能力 - 成本高(不管是什么任务可能都要思考、规划、验证) - 行为不稳定(每次生成的内容不确定性太大) 解决了复杂任务需要自主规划执行的问题
Skills 将一类任务的知识、流程和工具封装成可被 Agent 调用的标准化能力模块 Skill ≈ Plugin + 任务流程 + 资源 文档解析 Skill、发邮件 Skill、UI设计 Skill - 能力边界清晰 - 稳定、可复用、可组合 - 易于系统调度 - 前期设计成本较高 解决了Agent 执行不稳定、不可控、上下文消耗大的问题

三:Skills 使用体验

在开始使用 Claude Skill 之前,需要完成一定的前置环境准备,包括安装 Claude Code,并接入可用的国内模型 API(如智谱、Kimi 等)。完成相关配置后,只需打开终端并输入 claude,即可直接启动并使用 Claude Code。

在这里插入图片描述

1. 手动开发

Claude 支持以“手动开发”的方式从零构建一个 Skill。一个 Skill 的核心在于其 SKILL.md 文件,Claude 官方明确要求了该文件由两部分组成:数据 + 说明文档。

在这里插入图片描述
在文件顶部,是采用 YAML frontmatter 形式编写的元数据,用于向系统描述这个 Skill 的基本属性,包括:

  • name:Skill 的名称(必要)
  • description:该 Skill 的功能说明及适用场景(必要)
  • allowed-tools:在该 Skill 执行过程中允许自动调用的工具
  • model:默认使用的模型
  • context:是否在独立的子 Agent 上下文中运行

在文件底部,是 Markdown 形式的说明文档,用于明确告知 Claude:这个 Skill 应该如何被理解、在什么情况下被触发,以及具体的执行方式和注意事项。这一部分本质上是对任务流程和使用规范的显式约束,也是 Skill 能否稳定生效的关键。

手动编写并接入了两个 Skill,分别用于文章润色和爬取外部资讯总结。从使用效果来看,这两个 Skill 都能够被 Claude 正确识别和调用。

  • 当输入具体 case 后,系统会先自动判断当前 query 是否匹配已有 Skill,并弹出提示询问是否启用;
  • 在确认后,Skill 会按照既定流程自动执行,整体效果符合预期,稳定性和可控性也明显优于单纯依赖 Prompt 的方式。

2. 导入已有skill

目前在 GitHub 上已经有不少开发者上传并分享了自己创作的 Skill,我们可以直接下载这些现成的 Skill 并在本地使用。导入方式相对简单:只需将下载后的 Skill 文件夹放入 Claude 的 Skill 目录中,即可完成加载并开始使用。

  • Claude官方Skill库:https://github.com/anthropics/skills
  • Skill库社区:https://skillsmp.com/

结合工作需要,导入了一个用于 UI / UX 设计的 Skill,这是一个围绕 UI 设计与产品体验构建的综合型 Skill,本质上是一个结构化的设计知识与最佳实践搜索数据库,覆盖了从视觉风格到技术实现的多个层面,目前热度很高。
GitHub 地址:https://github.com/nextlevelbuilder/ui-ux-pro-max-skill

  • 任务开始执行后,并不会直接进入生成阶段,Claude Code 会先通过一系列结构化的反问来澄清需求背景与设计约束,在信息足够完整后,再统一触发Skill 进行后续的设计生成流程。
  • 从最终效果来看,生成网页在整体视觉风格与布局设计上,相较于未使用 Skill 的情况下有了明显提升。无论是字体样式的选择、图标体系的丰富度,还是页面模块的组织方式,都更加成熟且具有设计感,整体结构也更为完整,基本达到了可以直接参考,甚至具备实际落地使用价值的水平。

四:一些好用的Skill推荐

名称 说明 链接
视频转Gif 支持将视频文件直接转换为10M以内的Gif的文件 https://www.coze.cn/?skill_share_pid=7597348147404357672
ui-ux-pro-max 内置包含57种UI 风格、95个色彩搭配方案、56 种字体组合、24 个图表类型、10个技术栈,98个UX 设计规范,适用于各种demo开发的ui设计 https://github.com/nextlevelbuilder/ui-ux-pro-max-skill
Skill Creator Anthropic官方打造的核心元技能,它通过对话式引导的方式,帮助用户快速创建自定义Skills,自动生成符合官方规范的SKILL.md文件及技能文件夹结构。 https://github.com/anthropics/skills/tree/main/skills/skill-creator
文档四件套-Docx 全面的Word文档创建、编辑和分析工具,支持跟踪更改、注释、格式化保留和文本提取。 https://github.com/anthropics/skills/tree/main/skills/docx
文档四件套-PPT 演示文稿创建、编辑和分析工具,支持从设计到实现的完整工作流。 https://github.com/anthropics/skills/tree/main/skills/pptx
文档四件套-PDF 全面的PDF处理工具包,用于提取文本和表格、创建新PDF、合并/拆分文档等。 https://github.com/anthropics/skills/tree/main/skills/pdf
文档四件套-Excel 全面的电子表格创建、编辑和分析工具,支持公式、格式化、数据分析和可视化。 https://github.com/anthropics/skills/tree/main/skills/xlsx
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐