继 MCP(Model Context Protocol)之后,Anthropic 最近又推出了 Skill(技能)。因工作需要,我近期快速上手并实践开发了一个 Skill,过程中积累了一些经验,整理成本文,希望能帮助更多同学:

  • 快速理解 Skill 到底是什么

  • 掌握关键要点,提升 Skill 的开发质量与效率

在第三部分,我将通过一个具体案例,完整展示如何将一个想法快速落地为可运行的 Skill。即使你对 Skill 还一知半解,只要能清晰描述需求、准备好相关资料,也能轻松开发出一个高质量的 Skill。

文章有很多主观性,仅供参考。

一、快速认识 Skill

Skill 即技能,一般放在 skills 文件夹内,一个技能一个文件夹,一个技能通常包括 SKILL.md 文件,相关的文档和可运行的脚本等。

一个 SKILL  文件通常包括一个 YAML 头和 Markdown 格式的技能描述。

技能描述中可以提及 Skill 中的其他资和脚本等,Agent 会按需加载。

SKILL.md 中 YAML 的元信息,总是会放到上下文中, Body 部分在技能触发的时候才会加载,要小于 5K,其他的文件(文本文件、可运行的脚本、数据等)没有限制。

Agent 的系统提示词和 Skill 的元信息始终会在上下文中,这样 Agent 根据对话动态决策使用哪个技能,以及根据技能描述动态加载所需要的资源。

详情参见:https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

补充:https://code.claude.com/docs/en/skills

目前主要在 Claude 桌面、Claude Code 和 API 里面使用。很多其他 AI  Coding 工具,如

Antigravity :

参见:https://antigravity.google/docs/skills

Qwen Code 

参见:https://qwenlm.github.io/qwen-code-docs/zh/users/features/skills/也已经支持 Skills。

如果工具本身暂时没有直接支持,可以借助 OpenSkills 这个开源项目来使用 Skills:

OpenSkills brings Anthropic's skills system to all AI coding agents(Claude Code, Cursor, Windsurf, Aider).

OpenSkills 可以非常方便地将 skill 安装到全局或项目级 skills 文件中,自动创建项目规则 Markdown 文件,“教会”其他 AI Agent 使用 Skills。

  • 常用命令

  • 安装工具:npm i -g openskills

  • 安装技能:openskills install anthropics/skills

  • 安装技能(全局):openskills install anthropics/skills --global

  • 安装技能(通用模式):openskills install anthropics/skills --universal

  • 安装技能(非交互):openskills install anthropics/skills --yes

  • 同步到 AGENTS.md:openskills sync

  • 同步到自定义文件:openskills sync -o .ruler/AGENTS.md

  • 同步(非交互):openskills sync -y

  • 读取技能:openskills read

  • 列出技能:openskills list

  • 管理技能(交互删除):openskills manage

  • 删除技能:openskills remove

详情参见:https://github.com/numman-ali/openskills

二、Skill VS  MCP

说实话,最开始听到的时候还是有点懵逼的,不是已经有了 MCP 了吗?为啥还出一个 Skill?

图片来源:https://skillsmp.com/docs

简单来说,技能就是怎么做;MCP 是有什么工具、有什么功能。

技能的话,主要是经验、最佳实践、流程的封装,而 MCP 是连接与交互的协议,主要是 API 调用、数据读写和工具等。

Skills主要是 Markdown 文件和一些脚本文件,优势在于渐进式加载,不需要服务器资源,适用性好;MCP 主要是客户端和服务端的架构,启动时加载所有工具定义,集成外部功能,Tokens 消耗更高,使用起来更复杂。

两者是互补的关系,Agent 可以通过 Skills 获取知识,通过 MCP 拓展功能。

当然,现在 Rule、MCP、Skill 边界也越来越模糊。

三、快速开发 Skill 的最佳实践

我们已经对 Skill 有了一个初步的认识,也大概了解它和 MCP 的区别。那么接下来,如何快速、高质量地开发一个 Skill?

这里分享自己总结的一套最佳实践。

传送门:https://github.com/anthropics/skills

有些人知道官方给出了一个 skills 开源仓库,里面有很多 skill 示例。

有些同学可能想到了,我们下载下来学习一下,参考一下,自己写一个呗!

且慢!我们为啥要自己写?

说实话,如果我们自己手写,还是比较浪费时间的。我们需要去思考文件的结构、提示词的布局,要花很多时间,而且未必能写好。

上下文工程实践

这里分享一个自己探索的最佳实践。

首先,咱们先把 Claude 的 Skills 仓库源码拉下来。

这里面不仅有 Skill 的例子,而且还有非常详细的规约。不过都是英文的。

,时长00:57

学习 AI 的开源项目我会习惯用 Qoder 对代码仓库生成一个仓库 Wiki。 可以快速熟悉对应的结构、原理和知识。

当然,我们还可以把 Skill 相关的高质量资料,灌到 NotebookLM 中,各种提问,生成信息图(上图)、视频概览、PPT 等快速学习。

我们需要思想转变,一个是默认让 AI来做。因此,我们默认 Claude 的 Skills 就该 AI  来写。

一个是既然让 AI 做事情,就需要把任务拆解到模型能力以内,把任务描述清楚,并提供充足准确的上下文。

我们已经有了啥?

有了它的这些官方的优质案例、 Skill 的规约,还有了仓库 Wiki。

我们需要做的是把我们的任务表达清楚,然后把他写技能所需要的资料都给到它就可以了!

说了这么多,具体怎么做?

我一直想做一个“提示词优化专家”工具。

  • 现在很多提示词调优工具,没有澄清就直接优化,而且一般都会套一个比较通用的框架。

  • 最好是让 AI 判断是否存在错误或歧义,对焦好了以后再优化。通用提示词框架经常比不上最贴切和专业的框架,哪怕做 AI 业务的同学也不可能记住那么多专业框架,为啥比如不让 AI自动匹配呢?

趁着学习 Skill 的机会尝试搞成一个 Skill 试试看。

我只需要把逻辑捋清楚,还要把他需要的资料整理出来。

逻辑:

1. 当用户给出原始提示词或创作想法时;

2. 我们需要匹配最专业的提示词框架,判断是否存在歧义和遗漏。若存在,提示用户补充;

3. 若不存在,则按最佳框架撰写成专业提示词。

素材:

各种专业的提示词框架。 这些提示词框架,也是通过  AI Coding 工具中使用 MCP 爬下来的(如 Qoder MCP 广场中的 fetch 或者自己配置 Firecrawl)。

虽然,Claude 支持“渐进式加载”。

我们也不要让智能体把所有框架都加载进来,再做判断,这样既浪费 tokens 又慢。

我们把所有框架准备一份摘要 Markdown(摘要也是使用  Qoder 或 Cursor 这类工具, 根据 57个框架自动汇总出来的)。

它先看摘要,从中匹配出最合适的框架,再去针对性得读对应框架详情文件即可。

,时长01:46

那我们把我们的想法描述清楚,把我们的资源给到他,他就能够帮我们写出非常专业清晰的 Skill。说实话可能比我们自己写强很多。

当然,这也是有前提的:选择目前全球最顶尖的模型。

注:原本的“提示词框架”文件夹其实已经被修改为“prompt-optimizer” skill,只是为了让大家理解所以重新 Copy 进来。

我的 prompt-optimizer Skills Github 地址:

https://github.com/chujianyun/skills

,时长01:50

当然,我们也可以通过 Qoder 或 Cursor 把 Claude 的Skills 仓库压缩成一个 Skill 模板,后续作为 AI Coding 工具的项目 Rule,再让 AI Coding 工具拿到这个规则和我们的需求和上下文,帮我们生成也可以。

有些同学说了,你这个写得挺快的,看着也不错,但好不好使?

我们在 Claude Code 里试一试:

,时长03:04

我们创建了一个测试项目,叫 skill-test,然后在项目的 `.claude/skill 里把我们的技能放进去。

接着我们告诉它要优化一个提示词。

我们看到它匹配到了我们的技能,并按照技能中的指引读取了摘要文件,匹配到最适合的框架后,再去读取对应框架的详情。

给出选择 RACE 框架的原因和优化后的提示词。

最后给出一个非常专业、全面的优化提示词,而且还贴心得给出了一个精简版。

这样的好处就是不需要依赖 Claude 的 Skill,也可以生成很高质量的 Skill。

官方 skill-creator 

突发奇想,是不是可以搞一个 创建 skill 的 skill 呢?

结果居然发现, Claude 也提供了一个 skill-creator  !!!!

,时长02:37

那么,大家就可以创建一个空的目录,像前面一样将资料放进去,把  skill-creator 放到技能目录中,让 它帮我们生成。

,时长00:51

生成出来的 Skill 非常专业。

所以,我们要做的不是关心 Skill 怎么写,而是如何表达清楚,如何给足 AI 上下文。

四、Claude Skill 自身的最佳实践

1. 核心设计哲学:不仅要写给 AI 看,还要省着写

  • 上下文是公共品 (Public Good):你的 Skill 会与系统提示词、对话历史和其他 Skill 共享上下文窗口。

  • 默认假设 Claude 很聪明:不要解释显而易见的概念(如“什么是 PDF”)。只提供它不知道的特定上下文。

  • 每个 Token 都要接受质问:“Claude 真的需要这句话吗?”、“删掉这段会影响效果吗?”。

  • SKILL.md 的黄金法则:

  • 保持精简:一旦加载,每个 Token 都在烧钱并占用注意力。

  • 500 行限制:主文件体保持在 500 行以内,超过则需拆分。

2. 自由度控制 (Degrees of Freedom)

根据任务的容错率,设定不同的指令严格程度:

  • 低自由度 (Low Freedom):适用于数据库迁移等高风险操作。

  • 比喻:悬崖边的独木桥。

  • 做法:提供精确的脚本、严格的步骤,不留发挥空间。

  • 中自由度 (Medium Freedom):适用于有首选模式但允许微调的任务。

  • 做法:提供伪代码或带参数的脚本。

  • 高自由度 (High Freedom):适用于代码审查或创意写作。

  • 比喻:开阔的平原。

  • 做法:提供大致方向,相信 Claude 的判断。

3. 结构与文件组织:渐进式披露 (Progressive Disclosure)

不要一次性把所有东西都塞进上下文,而是像“洋葱”一样一层层剥开。

  • 文件系统架构:Claude 像操作 Linux 文件系统一样操作 Skill。它只在需要时通过 read 工具读取特定文件。

  • 三种组织模式:

a.概览 + 引用:SKILL.md 只是目录,详情在 REFERENCE.md

b.领域隔离:销售看 sales/,财务看 finance/,互不干扰。

c.按需加载:只有用户提到特定功能(如 "红线修订")时,才去读对应的高级文档。

  • 避免深层嵌套:引用层级不要超过 1 层(SKILL.md -> ref.md,不要再 -> sub_ref.md),否则 Claude 可能偷懒只读部分内容。

  • 路径规范:永远使用正斜杠 /(Unix 风格),严禁使用 Windows 的反斜杠 \

4. 命名与元数据规范

  • Name (名称):

  • 推荐使用 动名词形式 (Gerund form):如 processing-pdfsanalyzing-spreadsheets

  • 规则:仅限小写字母、数字、连字符。

  • 避免:helperutils 这种毫无意义的名字。

  • Description (描述):

  • 至关重要:这是 Claude 在 100+ 个 Skill 中决定是否调用你的唯一依据。

  • 第三人称写法:不要用 "I can..." 或 "You use...",直接写 "Processes Excel files..."。

  • 包含触发词:明确写出 Skill 做什么以及何时使用。

5. 迭代开发流:用 Claude 训练 Claude

不要完全自己手写,利用 AI 的能力来生成和优化 Skill。

  • 角色分工:

  • Claude A (架构师):负责编写和优化 Skill 文档。

  • Claude B (测试员):加载 Skill 进行实战测试。

  • 开发循环:

a.先裸跑任务,识别出必须的上下文和模式。

b.让 Claude A 将这些模式总结为 Skill。

c.让 Claude B 使用该 Skill 执行任务。

d.观察 Claude B 的失败点(如忘记过滤测试账号),反馈给 Claude A 修正。

  • 多模型测试:必须在 Haiku (测试引导是否足够)、Sonnet (测试效率)、Opus (测试是否啰嗦) 上都跑通。

6. 进阶:代码与执行 (Executable Skills)

对于复杂任务,代码脚本 > 纯文本指令。

  • Plan-Validate-Execute 模式:

  • 对于批量或高风险操作(如修改 50 个表单字段),不要直接执行。

  • 流程:分析 -> 生成计划文件 (changes.json) -> 运行脚本验证计划 -> 执行 -> 确认。

  • 错误处理:脚本必须显式抛出具体错误(如 "Field 'date' not found"),而不是把报错扔给 Claude 去猜。

  • 避免魔术数字:所有配置项必须有文档说明,不要让 Claude 猜参数。

  • MCP 工具调用:必须使用全限定名 ServerName:tool_name(例如 GitHub:create_issue),防止工具冲突。

7. 避坑速查表
  • ❌ 拒绝:包含时间敏感信息(如 "当前是 2024 年"),除非放在 "Old Patterns" 章节。

  • ❌ 拒绝:术语不一致(一会叫 "URL",一会叫 "Endpoint")。

  • ❌ 拒绝:在 Windows 上写出 scripts\run.py 这样的路径。

  • ✅ 必须:为超过 100 行的参考文件添加目录 (TOC)。

  • ✅ 必须:在发布前创建至少 3 个评估测试用例。

参见:https://platform.claude.com/docs/en/agents-and-tools/agent-skills/best-practices

五、写在最后

这篇文章简单谈谈自己对 Skill 的理解,以及用一个具体的案例展示如何快速地开发出一个相对高质量的 Skill。

当模型足够强大的时候,我们的工作方式会发生比较大的变化。我们更多的是需要把自己的想法表达清楚,第二是把 AI 干活所需要的信息给充足。

因此,我们如果需要再去研发一些 Skill 的时候,我觉得可能更多的是关注其中的逻辑是什么样的,然后把资料准备充足。那具体怎么写,可以交给最强大的模型,帮我们去做。

参考资料:

[1] https://github.com/numman-ali/openskills

[2] https://github.com/anthropics/skills

[3] https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

[4]https://code.claude.com/docs/en/skills

如何学习AGI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

**

一、2025最新大模型学习路线

一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。

我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1级别:AI大模型时代的华丽登场

L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。

L2级别:AI大模型RAG应用开发工程

L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3级别:大模型Agent应用架构进阶实践

L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。

L4级别:大模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。

二、大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

三、大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

四、大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

五、大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。


因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐