【Agent Skills】教程！大模型入门到进阶，一套全解决(1)

Agent Skills 是为 AI Agent 打造的模块化、标准化能力扩展系统，以文件夹为单位，将完成特定任务所需的指令、脚本、资源文件进行结构化封装，让大模型在需要时自动加载、执行，实现任务的标准化、高效化完成。把大模型比作新员工，Skill 就是为其量身定制的入职手册 + 操作规范，不用每次重复讲解工作流程，员工就能按标准完成任务；把大模型比作厨师，Skill 就是标准化菜谱 + 食材处理

weixin_44673517

359人浏览 · 2026-03-06 10:47:04

weixin_44673517 · 2026-03-06 10:47:04 发布

Agent Skills 从入门到进阶：大模型能力升级核心指南

Agent Skills 作为 Anthropic 推出的大模型能力扩展标准，已成为提升 AI Agent 专业执行能力的核心方式，从基础概念到工程化实战，一套体系就能实现大模型从通用问答到标准化任务执行的升级。本次从核心价值、底层原理、实操方法、生态融合等维度，完成 Agent Skills 的全体系学习，让大模型真正成为贴合实际需求的专业助手。

一、为什么要使用 Agent Skills：大模型的能力补全方案

通用大模型本身具备强大的理解和生成能力，但在实际落地中，始终存在执行不标准、上下文资源浪费、能力不可复用三大痛点，而 Agent Skills 正是针对这些问题的最优解，这也是其从单一功能模块发展为开放标准的核心原因。

解决通用大模型的「执行短板」：通用大模型仅能基于知识给出解决方案，却缺乏标准化的任务执行流程，Agent Skills 将领域知识、操作步骤、工具调用方法封装为技能包，让大模型像人类领域专家一样，按规范完成端到端任务。
极致优化上下文资源占用：传统 Prompt 方式会将所有指令一次性塞入上下文窗口，造成大量 Token 浪费，Agent Skills 采用渐进式披露设计，仅在需要时按需加载对应内容，大幅降低推理成本，同时避免上下文冗余。
实现能力的模块化复用与分享：一套 Skill 可在多个 AI 工具、多个场景中重复使用，也能像插件一样在社区分享、安装，解决了手动编写 Prompt 的「一次性成本」问题，让大模型的能力扩展从「重复造轮子」变为「模块化组装」。
降低大模型的使用门槛：无需用户掌握复杂的 Prompt 技巧，也不用了解底层工具调用逻辑，只需加载对应的 Skill，大模型就能自动匹配、执行任务，让非技术人员也能高效使用大模型的专业能力。

简单来说，没有 Skills 的大模型是「样样懂一点，但样样不精通」的通才，而加载了 Skills 的大模型，能快速成为「术业有专攻」的专才，真正实现从「能说」到「会做」的跨越。

二、Agent Skills 核心认知：概念、结构与设计理念

想要用好 Agent Skills，首先要理解其核心定义、标准化结构和底层设计逻辑，这是后续实操和开发的基础，也是区分其与 Prompt、工具调用等概念的关键。

1. 核心定义

Agent Skills 是为 AI Agent 打造的模块化、标准化能力扩展系统，以文件夹为单位，将完成特定任务所需的指令、脚本、资源文件进行结构化封装，让大模型在需要时自动加载、执行，实现任务的标准化、高效化完成。可以用两个通俗的比喻理解：

把大模型比作新员工，Skill 就是为其量身定制的入职手册 + 操作规范，不用每次重复讲解工作流程，员工就能按标准完成任务；
把大模型比作厨师，Skill 就是标准化菜谱 + 食材处理指南，让厨师能稳定做出符合要求的菜品，而非凭经验随意发挥。

2. 标准化文件结构

一个完整的 Agent Skill 是一个独立文件夹，遵循固定的结构规范，由1 个必需文件 + 3 个可选文件夹组成，所有组件围绕「让大模型理解并执行任务」设计，结构清晰且可拓展：

plaintext

my-skill/  # 技能文件夹，名称为技能标识
├── SKILL.md  # 必需核心文件：元数据+详细执行指令
├── references/  # 可选：参考资料文件夹，存放领域规范、故障指南等
├── scripts/  # 可选：可执行脚本文件夹，存放py/js等可调用代码
└── assets/  # 可选：资源文件夹，存放模板、图片、字体等静态资源

其中SKILL.md是核心中的核心，由YAML 前置元数据和Markdown 正文指令两部分组成：

YAML 元数据：大模型的「技能识别入口」，包含name（技能名，小写字母 + 连字符）和description（技能描述，写清适用场景），是大模型自动匹配任务的关键；
Markdown 正文：大模型的「详细操作手册」，包含任务流程、输入输出规范、注意事项、示例等，让大模型明确如何执行任务。

3. 底层设计理念：渐进式披露

Agent Skills 的核心设计哲学是Progressive Disclosure（渐进式披露），简单来说就是「按需加载，分层获取」，将技能内容分为三层，不同阶段加载不同内容，平衡执行效果和资源效率：

L1 层：元数据（约 100 Token）：Agent 启动时加载，仅包含技能名和描述，用于快速构建技能列表，实现初步任务匹配；
L2 层：SKILL.md 主体（<5000 Token）：技能被触发时加载，包含完整的执行指令和流程，让 Agent 掌握任务的核心逻辑；
L3 层：附属资源（理论无上限）：执行任务时按需加载，包含脚本、参考资料、资源文件等，支撑任务的实际落地。

这种设计让 Agent 无需时刻加载所有技能的完整内容，仅在需要时调取对应资源，既保证了执行的专业性，又最大化节省了 Token 和内存资源。

三、Agent Skills 与相关概念的核心区别：理清体系关系

在大模型生态中，Agent Skills 常与 Tools、MCP、Subagents、Prompt 等概念混淆，理清它们之间的关系和差异，才能实现各组件的高效搭配，构建强大的 AI Agent 系统。这也是从入门到进阶的关键一步，核心是明确各组件的定位和解决的核心问题：

1. Prompt → Tools → Skills → Subagents → MCP：能力层级升级

从基础到高级，大模型的能力扩展遵循清晰的层级关系，每一层都解决上一层的痛点，实现能力的迭代升级：

Prompt（最基础）：纯文字指令，实现简单的需求交互，痛点是不可复用、易冗余、执行不标准；
Tools（底层能力）：大模型与外部系统交互的原子操作，如读取文件、执行代码、访问数据库，解决「大模型能做什么」的问题；
Skills（工作流组合）：告诉大模型如何用工具完成特定任务，是工具的组合与规范，解决「大模型怎么做」的问题；
Subagents（并行执行单元）：大模型的「分身」，具备独立上下文和细粒度权限，可并行执行任务，解决「大模型如何高效做复杂任务」的问题；
MCP（外部数据桥梁）：连接外部系统和数据，提供外部工具和资源，解决「大模型能获取什么外部信息」的问题。

2. 核心组件对比：明确定位，精准搭配

表格

组件	核心定位	解决的核心问题	类比	加载 / 执行特点
Tools	底层原子操作	大模型能做什么基础动作	锤子、锯子、钉子	始终在上下文，显式调用
Skills	标准化工作流	大模型如何用工具完成特定任务	用工具做书架的步骤指南	按需加载，自动匹配
MCP	外部数据 / 工具连接器	大模型能获取什么外部信息	外部物料供应商	按需对接，提供外部资源
Subagents	独立并行执行单元	大模型如何高效处理复杂任务	分工协作的小弟	独立上下文，并行执行

核心协作逻辑：MCP 提供外部工具和数据 → Skills 定义使用工具 / 数据的标准化流程 → Subagents 加载对应 Skills 并行执行子任务 → 主 Agent 汇总结果，完成复杂任务。

四、Agent Skills 实操：安装、使用与自定义开发

掌握基础概念后，核心就是落地实操，Agent Skills 的实操分为基础使用（安装现成技能）和进阶开发（自定义技能），同时支持多端部署，覆盖 Claude.ai、Claude Code、Claude API 等主流平台，零编程基础也能快速上手基础使用。

1. 基础使用：安装并调用现成 Skill

Anthropic 提供了大量官方预置 Skill，涵盖文档处理、代码开发、数据分析等高频场景，同时社区也有丰富的开源 Skill，安装方式简单，支持 ** 命令行（Claude Code）和可视化界面（Claude.ai）** 两种方式：

方式 1：Claude Code（命令行）—— 开发者首选

bash

运行

# 1. 注册Anthropic官方技能仓库
plugin marketplace add anthropics/skills
# 2. 安装官方预置技能（如文档处理技能）
plugin install document-skills@anthropic-agent-skills
# 3. 安装社区开源示例技能
plugin install example-skills@anthropic-agent-skills

安装完成后，大模型会自动匹配任务并调用技能，也可通过斜杠命令手动触发，如/docx（Word 文档处理）、/pdf（PDF 处理）。

方式 2：Claude.ai（网页 / 移动端）—— 非技术人员首选

进入 Claude.ai，登录付费计划（Pro/Max/Team/Enterprise）账号；
在设置中找到「Skills」模块，点击「添加技能」；
选择官方预置技能或上传社区分享的技能文件夹，完成安装；
直接输入自然语言需求，大模型会自动调用对应技能执行任务。

2. 进阶开发：自定义打造专属 Skill

当官方技能无法满足个性化需求时，可自定义开发 Skill，核心遵循标准化文件结构，无需复杂编程能力，只需按规范编写 SKILL.md，零基础也能完成简单技能的开发，核心步骤分为 3 步：

步骤 1：创建技能文件夹

新建文件夹，命名为技能标识（如brand-material-creator，小写字母 + 连字符），作为技能根目录。

步骤 2：编写核心文件 SKILL.md

这是自定义技能的核心，按「YAML 元数据 + Markdown 正文」编写，示例如下（品牌物料生成技能）：

markdown

---
name: brand-material-creator
description: 根据品牌规范生成海报、社交媒体配图等营销物料的创意方案，包含主题、文案、视觉描述，当用户需要制作品牌营销物料时调用。
---
# 品牌物料创意生成技能
## 品牌基础规范
- 品牌名称：XX茶饮
- 主色系：#FF6B6B（暖红）、#F7FFF7（米白）
- 品牌调性：年轻、清新、性价比
## 任务执行流程
1. 确认用户需要的物料类型（海报/朋友圈配图/小红书封面）；
2. 确认物料的核心宣传点（新品/优惠/节日）；
3. 按品牌规范生成3套创意方案，每套包含「主题+核心文案+视觉描述」；
4. 向用户展示方案，等待反馈并优化。
## 输出格式要求
- 分点展示每套方案，结构清晰；
- 视觉描述具体，包含色彩、元素、布局；
- 文案符合品牌调性，简洁易传播。

步骤 3：添加可选资源（按需）

根据技能需求，在references/、scripts/、assets/文件夹中添加对应资源，如：

在assets/中放入品牌 logo、字体文件；
在references/中放入品牌视觉规范文档；
在scripts/中编写简单的 py 脚本，实现文案的批量生成。

步骤 4：测试与部署

将技能文件夹上传至 Claude.ai 或通过 Claude Code 加载，输入测试需求，验证技能是否能正常匹配、执行，根据测试结果优化 SKILL.md 中的指令和流程，完成后即可正式使用。

3. 多端部署：一套技能，全平台使用

Agent Skills 遵循开放标准，实现了一次开发，多端部署，开发完成的技能可直接在 Anthropic 全系平台使用，无需重复适配：

Claude.ai：网页 / 移动端可视化使用，适合日常办公；
Claude Code：命令行 / 编程环境使用，适合开发者；
Claude API：对接自有系统 / 应用，适合企业级开发；
Claude Agent SDK：集成到自定义 AI Agent 中，适合智能体开发。

五、官方预置核心 Skill：高频场景直接复用

Anthropic 提供了大量生产级的官方预置 Skill，覆盖文档处理、代码开发、创意设计等高频场景，其中文档处理四件套是工程含量最高、实用性最强的技能，直接复用就能解决大部分办公场景的需求：

docx Skill：Word 文档处理，支持创建、编辑、分析.docx 文件，内含生产实践的避坑经验，如表格双重复宽、列表标准化配置等；
pdf Skill：PDF 全功能工具集，支持文字 / 表格提取、合并 / 拆分、OCR、加密，搭配模块化子文档，实现精细化处理；
pptx Skill：PowerPoint 演示文稿处理，支持创建、编辑、模板生成，明确规避「AI 味」劣质幻灯片，提供预设配色和字体方案；
xlsx Skill：Excel 电子表格处理，支持创建、编辑、数据分析，核心原则是写动态公式而非硬编码结果，保证数据联动更新。

这些预置 Skill 均采用生产级的设计，内含大量实战避坑经验，是学习 Skill 开发的最佳参考，也能直接解决日常工作中的文档处理需求。

六、Agent Skills 实战融合：构建专业 AI Agent 系统

单独的 Skill 能解决单一任务，而将 Skills 与 MCP、Subagents 结合，就能构建出能处理复杂任务的专业 AI Agent 系统，这也是 Agent Skills 从基础使用到进阶应用的核心，核心遵循「模块化组装，标准化执行」的原则，以客户洞察分析器为例，看完整的实战融合流程：

MCP 对接外部数据：连接客户数据库、市场调查结果、用户访谈记录等外部资源，为 Agent 提供数据支撑；
Subagents 分工协作：创建多个子 Agent，分别加载「访谈分析 Skill」「调查数据统计 Skill」「市场趋势分析 Skill」，并行处理不同数据源；
Skills 标准化执行：每个子 Agent 按对应 Skill 的规范，完成数据处理和分析，保证执行结果的标准化和专业性；
主 Agent 汇总输出：主 Agent 收集所有子 Agent 的分析结果，加载「报告生成 Skill」，按规范生成完整的客户洞察报告，输出给用户。

这套流程实现了复杂任务的拆分 - 并行处理 - 标准化执行 - 汇总输出，大幅提升了 AI Agent 处理复杂任务的效率和质量，也是企业级 AI Agent 开发的核心模式。

七、学习与实践建议：从入门到精通的路径

Agent Skills 的学习门槛低，从基础使用到进阶开发可按以下路径逐步推进，无需一蹴而就，重点在边用边学，边练边优化：

入门阶段：使用官方预置 Skill，体验技能的自动匹配和执行，熟悉不同技能的适用场景，理解「渐进式披露」的实际效果；
进阶阶段：基于官方 Skill 进行简单修改，适配自身个性化需求，学习 SKILL.md 的编写技巧，掌握自定义技能的基础规范；
精通阶段：独立开发专属 Skill，结合脚本、资源文件实现复杂任务，将 Skills 与 MCP、Subagents 融合，构建自定义 AI Agent 系统；
生态阶段：参与开源社区，分享自己开发的 Skill，学习社区优秀的 Skill 设计思路，实现能力的共建共享。

同时，学习过程中要重点关注技能的实用性和标准化，避免过度设计，核心是让 Skill 能解决实际问题，而非追求技术的复杂程度。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026年电子工程师实战手册：AI辅助硬件开发与嵌入式调试全流程

2048 AI社区

AI Agent详解

最近 AI 圈子里最火的词就是 Agent。无论是字节、阿里还是腾讯的招聘 JD，几乎都把 Agent 开发能力列为加分项或必备技能。很多小伙伴（包括我刚入门时）都觉得 Agent “听起来很高大上”，其实它就是让大模型（LLM）从“只会聊天”变成“能真正干活”的关键进化。本文将一步步、零基础地给你讲透以下三个核心问题：1.什么是 Agent？2.它和LLM有什么本质不同？大模型有哪些致命局限性？