Agent Skills是一种标准化格式,旨在为AI智能体提供专业知识和工作流程。它通过“技能包”机制,将指令、脚本和资源组织成文件夹,使智能体能自动发现并执行,提升工作效率。Agent Skills解决了AI在领域专业知识、组织特定上下文和可重复工作流程方面的不足,避免了提示词漂移、工作流约定丢失和指令膨胀等问题。它具有领域专业化、能力扩展、可重复工作流和跨平台互操作性的核心价值,适用于代码审查、文档生成、数据分析等多种场景。通过基于文件系统的架构和渐进式加载机制,Agent Skills实现了高效使用上下文,让AI更精准地完成工作。

AI 智能体越来越强,但在实际工作中,它们往往缺少必要的上下文和专业知识。比如,让智能体处理一份法律文档,它可能不知道行业特定的审查流程;让它分析数据,它可能不清楚团队偏好的报告格式。Agent Skills(智能体技能) 就是为了解决这个问题而生的:用一套标准化的格式,把专业知识、工作流程和组织规范「打包」成可复用的技能,让智能体在需要时自动加载和使用。

本文介绍 Agent Skills 的相关概念、与 MCP 的区别、应用场景。

Agent Skills 的架构:

1、Agent Skills 是什么

Agent Skills 是一个开放的、标准化的格式,用于给 AI 智能体提供新的能力和专业知识。简单来说,它是一套「技能包」机制:把指令、脚本和资源组织成文件夹,智能体可以自动发现并在相关任务中使用,从而更准确、更高效地完成工作。

可以这样理解:

  • 不是:给智能体装一个插件或调用某个新 API
  • 而是:把「在什么情况下、按什么步骤、产出什么格式」写成标准化的技能包,智能体在遇到匹配的任务时自动加载并执行

Agent Skills 最初由 Anthropic 开发,并作为开放标准发布。现在,这个格式已经被多个主流的 AI 开发工具采用,形成了一个开放的生态系统。

2、 为什么需要 Agent Skills

AI 智能体的通用能力很强,但在实际业务场景中,它们往往缺少三类关键信息:

  • 领域专业知识:法律审查流程、数据分析管道、医疗诊断规范等
  • 组织特定上下文:公司的命名规范、团队的代码审查标准、项目的目录结构等
  • 可重复的工作流程:多步骤任务的标准化流程,确保每次执行都一致且可审计

在实际使用中,团队依赖智能体处理复杂工作流时,会遇到三个典型问题:

  • 提示词漂移(Prompts Drift):两个人用不同措辞问同样的问题,可能得到不同结果;即使在同一流程的不同步骤中,智能体的行为也可能不一致。没有统一的指令,智能体在执行相同任务时表现也会变化
  • 工作流约定丢失:每个流程都有自己的质量检查、验证、审批流程、数据格式和决策标准。没有指导,智能体无法正确推断这些约定,而每次任务都重新说明这些约定又无法规模化
  • 指令膨胀占用上下文:把详细的操作手册复制到提示词中,会与智能体需要推理的其他内容竞争空间,关键的工作流上下文被埋没

Agent Skills 通过「按需加载」的方式解决这些问题:智能体在启动时只加载技能的元数据(知道有哪些技能可用),当任务匹配到某个技能时,才加载该技能的详细指令和资源。这样既能扩展智能体的能力,又不会让上下文窗口被不相关的信息占满。

更重要的是,Skills 把原本分散在每次对话中的指令(比如「按我们团队的代码审查标准来」),提取出来写成标准化的技能文件,放在代码仓库或统一目录里。这样团队可以一起审查、用版本控制追踪变更,一次写好、多次复用,不用每次对话都重复说明。

3、Agent Skills 的核心价值

Agent Skills 主要带来四个方面的价值:

  • 🎯 领域专业化:将专业知识打包成可复用的指令,从法律审查流程到数据分析管道,让通用智能体变成领域专家
  • 🚀 新能力扩展:给智能体添加原本不具备的能力,比如创建演示文稿、构建 MCP 服务器、分析数据集等
  • 🔄 可重复工作流:把多步骤任务转化为一致且可审计的工作流程,确保每次执行都遵循相同的标准
  • 🔌 跨平台互操作性:同一份技能可以在多个支持该标准的智能体产品中复用,一次编写,多处使用

对于不同角色,Agent Skills 的价值也不同:

  • 技能作者:编写一次,部署到多个智能体产品
  • 智能体开发者:支持技能格式后,用户可以开箱即用地给智能体添加新能力
  • 团队和企业:将组织知识打包成可移植、可版本控制的技能包

4、Agent Skills 与其他概念的区别

在 AI 智能体的配置中,Skills、MCP 服务器、工具(Tools)、规则(Rules)和系统提示词(System Prompts)各自解决不同方面的问题:

  • Skills:打包完整的工作流,结合指令、上下文和决策逻辑。不仅告诉智能体有哪些工具可用,还说明何时使用、如何排序操作、成功标准是什么。最适合需要上下文决策的复杂多步骤流程
  • MCP 服务器:提供标准化的接口,让智能体访问外部工具和服务。处理 AI 系统与第三方 API 之间的技术集成,最适合工具集成和 API 访问
  • 工具(Tools):提供单个函数,智能体可以调用来执行特定操作。每个工具处理一个离散操作,最适合单一用途的操作和 API 集成
  • 规则(Rules):定义 AI 行为的特定约束和逻辑。用于一致地应用安全策略、数据处理标准和操作约束,最适合合规要求和访问控制
  • 系统提示词:建立 AI 的基础行为和个性。设置初始上下文、沟通风格和基本能力,最适合定义核心行为和沟通风格

这些方法可以协同工作:Skills 可以引用 MCP 服务器,基于系统提示词构建,并融入基于规则的逻辑。

5、 Agent Skills 的典型应用场景

下面这些场景都很适合用 Agent Skills 来标准化和复用:

  • 🔍 代码审查与质量检查:按团队标准进行 PR 审查、代码质量评估、安全检查等,确保每次审查都遵循相同的标准和流程
  • 📝 文档生成与格式化:统一报告格式、邮件模板、技术文档结构,让智能体生成的文档符合组织规范
  • 📊 数据处理与分析:标准化的数据分析流程、报告生成模板、图表样式规范,确保分析结果的一致性和可读性
  • 🗄️ 数据库与 API 操作:查询数据库的标准流程、调用内部 API 的约定、数据验证规则等
  • ⚖️ 法律与合规审查:法律文档审查流程、合规检查清单、风险评估标准等专业领域知识
  • 🏥 医疗与诊断辅助:诊断流程规范、病历分析标准、报告格式要求等医疗专业知识
  • 🚀 发布与部署流程:发布前检查清单、版本管理规范、部署步骤标准化等 DevOps 流程
  • 📁 项目与团队规范:目录结构约定、命名规则、必须执行的脚本或检查项等组织级规范

凡是「希望智能体在某一类任务上每次都按同一套规则或流程来做」的场景,都可以考虑做成一个 Agent Skill。

6、Agent Skills 的技术架构

Agent Skills 采用基于文件系统的架构,每个技能是一个目录,包含:

my-skill/
├── SKILL.md          # Required: instructions + metadata
├── scripts/          # Optional: executable code
├── references/       # Optional: documentation
└── assets/           # Optional: templates, resources
  • SKILL.md:必选的主文件,包含 YAML 元数据和 Markdown 格式的指令正文
  • scripts:可选的脚本目录,包含可执行的辅助工具和自动化脚本
  • references:可选的参考文档目录,包含支持文档、示例和上下文文件
  • assets:可选资源目录,包含支持技能输出的文件,如模板、示例或其他工件

智能体通过「渐进式加载」机制使用技能:

  1. 元数据层:启动时加载所有技能的元数据(名称和描述),消耗很少的上下文
  2. 指令层:当任务匹配到某个技能时,加载该技能的 SKILL.md 正文
  3. 资源层:根据任务需要,按需加载参考文档、脚本或资源文件

这种设计的好处是:即使安装了大量技能,也不会让上下文窗口被占满;只有真正需要的技能内容才会被加载进来。

scripts/ 目录的作用:包含可执行的辅助工具,让技能更节省 token 且更确定。智能体可以运行脚本,而不是用自然语言重新推导多步骤过程。脚本也使审查更容易:如果某个步骤必须每次都正确,脚本代码可以直接运行验证、逐行检查逻辑,比自然语言段落更容易确保正确性。

references/ 目录的作用:用于按需加载的支持文档。智能体先看 SKILL.md 的摘要了解大致内容,需要详细信息时才加载 references/ 里的完整文档(就像先看目录,需要时才翻到具体章节)。一个实用的最佳实践是避免在 SKILL.mdreferences/ 中重复相同信息。如果参考文件很大,可以在 SKILL.md 中写明搜索关键词(比如「如果需要 API 详情,在 reference.md 中搜索 ‘API endpoint’」),这样智能体就能在大文件中快速定位需要的信息。

7、如何创建 Agent Skills

创建一个 Agent Skill 的基本步骤:

  1. 确定技能范围:明确这个技能要解决什么问题、在什么场景下使用
  2. 编写 SKILL.md:包含 YAML 头(name、description)和 Markdown 正文(指令、示例)
  3. 组织资源文件:根据需要添加参考文档、脚本、模板等
  4. 测试与优化:在实际场景中测试技能效果,根据反馈优化

SKILL.md 的描述部分很关键:它需要清楚地说明「做什么」和「什么时候用」,因为智能体主要靠这段描述来决定是否启用该技能。好的描述应该:

  • 用第三人称表述(因为会注入到系统提示中)
  • ✅ 好:「根据 git diff 生成符合规范的提交信息。在用户要求写提交信息、或要审查暂存变更时使用。」
  • ❌ 差:「我可以帮你写提交信息」或「你可以用这个技能来写提交信息」
  • 包含具体的触发关键词(如「PDF」「代码审查」「数据分析」)
  • 同时说明 WHAT(做什么)和 WHEN(何时使用)

8、 Agent Skills 的生态系统

Agent Skills 作为开放标准,正在被越来越多的 AI 开发工具和平台采用。这意味着:

  • 技能作者可以编写一次技能,在多个平台上使用
  • 开发者可以集成技能支持,让用户轻松扩展智能体能力
  • 企业可以将组织知识打包成可移植的技能包,在不同工具间共享

这种互操作性让 Agent Skills 不仅仅是一个功能特性,而是一个正在形成的生态系统。

9、为什么 Skills 很重要

团队将花费更多时间监督智能体。如果上下文和约定只存在于某人的聊天历史中,就无法审查它们、系统地更新它们,或在出现问题时调试它们。

Skills 使智能体行为更容易标准化。它们也使随着时间的推移改进变得更容易。可以将更好的工作流作为技能包的更改发布,而不是作为某人必须记住的新提示词。

如果上下文和约定只存在于某人的聊天历史中,就无法审查它们、系统地更新它们,或在出现问题时调试它们。Skills 将特定指令和专业知识从「上周某人的笔记」或「隐藏的提示词」中提取出来,放到一个集中的、可审查的地方,团队可以一起迭代。

小结

  • Agent Skills 是一个开放的、标准化的格式,用于给 AI 智能体提供新的能力和专业知识
  • 核心价值:领域专业化、能力扩展、可重复工作流、跨平台互操作性
  • 典型场景:代码审查、文档生成、数据分析、法律合规、医疗诊断、发布部署、团队规范等一切需要「标准化、可复用」的任务
  • 技术特点:基于文件系统的架构,采用渐进式加载机制,确保高效使用上下文
  • 解决的问题:提示词漂移、工作流约定丢失、指令膨胀占用上下文

如果经常需要让智能体「按我们的方式来做某某事」,不妨把这句话扩展成一份 Agent Skill。这样既能提高智能体在特定任务上的表现,又能让组织知识以可版本控制、可复用的形式沉淀下来。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

https://img-blog.csdnimg.cn/img_convert/05840567e2912bcdcdda7b15cba33d93.jpeg

在这里插入图片描述

为什么要学习大模型?

我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。

在这里插入图片描述

在这里插入图片描述

大模型入门到实战全套学习大礼包

1、大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

img


2、大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

在这里插入图片描述

3、AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

img

4、大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

img

5、大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

img

适用人群

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

https://img-blog.csdnimg.cn/img_convert/05840567e2912bcdcdda7b15cba33d93.jpeg

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐