什么是agent-skills
Agent Skills是Anthropic提出的AI智能体能力模块化解决方案,通过标准化文件夹结构封装特定任务能力。它将AI能力拆解为可复用的"技能包",采用渐进式加载机制降低token消耗(可减少60-80%)。核心特征包括自主决策(从被动执行到主动调用)、场景适应性和跨平台复用性。技能分为基础交互、决策规划、执行操作和学习进化四大类,支持代码脚本集成和知识检索增强。典型案
什么是agent-skills?
上周我在研究Claude Code的时候,突然发现Anthropic搞了个很有意思的东西——Agent Skills。
第一眼看到这个名字的时候,我有点困惑。这不就是给AI Agent加点技能包吗?这有什么好单独拎出来说的?但当我深入去了解之后,我发现这个事情远比我想象的要重要得多。
今天作为AI Native Coder,我想聊聊这个可能改变AI Agent开发范式的技术。
为什么是Skills?
先说个背景。
在2023-2024年的时候,大家都在疯狂做Agent。我也是那时候开始接触Claude Code、AutoGPT这些工具的。但很快就发现一个问题:每个Agent都得单独开发,代码没法复用,维护成本特别高。
我记得那时候有个项目,我给团队做了个代码审查的Agent。后来要做个技术文档生成的Agent,结果发现很多能力是重复的。但因为是硬编码在各个Agent里的,只能重新写。
这种重复造轮子的感觉,特别难受。
2025年10月,Anthropic推出了Agent Skills。我去看了他们的官方文档,一下子就明白了他们的想法。https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
他们把Agent Skills定义为"用文件和文件夹构建专业Agent的新方式"。
听起来很简单,但这个"文件和文件夹"的设计,其实是个挺聪明的决定。

核心概念:什么是Agent Skills?
从定义上来说,Agent Skills是智能体为完成特定任务而具备的能力集合。
但这个定义太抽象了。我换个更直白的说法:
如果说大模型是Agent的"大脑",那Skills就是Agent的"手脚"和"经验库"。
没有Skills的Agent,只是一个博学的空谈家——它能理解你要什么,但没法真 的去执行。有了Skills,它才能真正和数字世界交互,从"处理文本"进化到"解 决问题"。
在Anthropic的实现里,一个Skill本质上就是一个文件夹,核心是一个 SKILL.md文件。
我举个真实的例子。
假设你要给Agent加一个"PDF表单填写"的技能。传统的做法可能是写一大段prompt塞进系统提示词里。但Agent Skills的做法是创建一个pdf-form-filler文件夹,里面放个SKILL.md:
// markdown
---
name: "PDF Form Filler"
description: "提取PDF表单字段并完成填写,输出填写后的PDF文件"
version: "1.0.0"
---
这个技能用于处理PDF表单...
这个设计有个很重要的原则,叫"渐进式披露"(Progressive Disclosure)。
什么意思呢?
第一层:Agent启动时,只加载所有Skills的name和description(元数据),占 用极少token。
第二层:当任务需要某个Skill时,才加载该Skill的完整SKILL.md内容。
第三层:执行过程中如果需要,再加载该Skill关联的reference文档或脚本。
我实测过,在处理长链条业务流程时,这种架构能将上下文Token消耗降低60%-80%。这个数据还挺猛的。
为什么这么高呢?因为传统模式要把所有规则常驻在Context里,而Agent Skills是"用多少加载多少"。
Agent vs Skills的关系
我觉得这个关系可以这样理解:
Agent是"数字人",Skills是"专业能力"。
脱离Skills的Agent,只是具备基础推理能力的"空壳"。而优质的Skills体系, 能让Agent从"被动响应指令"升级为"主动解决问题"。
这就是为什么Meta在2025年收购Manus之后,重点强化Skills生态。他们看 中的就是这个能力:通过Skills体系,让通用Agent快速变成专业Agent。

三大核心特征
自主性
自主性是Agent Skills最核心的特征。
传统的工具调用模式,需要人类明确指示"调用什么工具"。但Agent Skills让AI能够自主判断"需要什么技能",并自动调用相关工具完成任务。
举个例子。
如果你用传统模式写个"查询天气"的功能,可能是这样的:
def get_weather(city):
# 调用天气API
return weather_data
但在Agent Skills体系里,你只需要定义Skill:
// markdown
---
name: "weather-query"
description: "查询指定城市的实时天气和未来3天预报"
---
Agent会根据用户的"北京明天天气怎么样"这个输入,自主判断需要调用weather-query这个Skill,然后执行查询。
这种从"被动执行"到"主动决策"的转变,是AI从"助手"升级为"员工"的关键标志。
适应性
适应性体现在两个层面。
场景层面:同一个Agent可以根据任务不同,动态加载不同的Skills。客服场景 加载"退换货处理"、"投诉处理"这些技能;开发场景加载"代码审查"、"单元测 试"这些技能。
数据层面:通过Reference机制,可以在需要时加载庞大的领域知识库。比如财 务制度、法律条款这些长文档,不是常驻Context,而是"提到'报销'时才加载制 度文档"。
这种设计让Agent能够快速适应不同场景,而且不会因为知识库太大而影响性能。
模块化与可复用性
这是我最喜欢的特性。
Agent Skills采用标准化的文件夹结构,每个技能本质上是一个包含SKILL.md文件的文件夹,内部整合"指令文档、可执行脚本、配套资源"三大要素。
这意味着什么?
意味着只要平台支持Agent Skills标准,就能直接调用文件夹内的所有能力,实现"一次开发,多端复用"。
我查了一下,现在Claude.ai、Claude Code、Claude Agent SDK、Claude Developer Platform都已经支持Agent Skills了。
SkillsLM这个工具甚至想成为AI Agent时代的npm,一键打通9大主流平台的技能管理。这个想法挺有野心的。
分类体系
根据功能属性和应用层级,Agent Skills可以分为四大类。我结合实例来说明。
基础交互技能:Agent的"沟通桥梁"
这类技能的核心作用是实现Agent与人类、外部系统或物理环境的信息交互。
包括:
• 自然语言处理(NLP):意图识别、语义理解、多轮对话。比如电商客服Agent 理解用户退换货需求。
• 计算机视觉(CV):图像检测、目标识别、场景理解。比如工业运维Agent通 过图像识别设备异常升温。
• 语音与传感交互:语音识别、合成、IoT传感器数据解析。比如智能家居 Agent通过语音指令控制设备。
决策规划技能:Agent的"思考中枢"
这部分是Agent的核心竞争力所在。
包括三个能力模块:
- 目标解析与任务拆解:将模糊目标转化为可执行的子任务序列。比如面对" 组织跨部门季度总结会议"这个需求,Agent可以拆解为:
确定会议时间→筛选场地→准备材料→发送通知→安排记录。
2. 风险评估与优先级排序:预判各子任务的难度、资源消耗、时间成本。比如 金融风控Agent会先筛选"高负债+无稳定收入"的高风险案例优先处理。
3. 动态适配与纠错优化:当出现工具调用失败、数据异常、环境变化时,Agent 能快速调整策略。比如智能办公Agent发现会议室被占用时,自动筛选备选场 地。
执行操作技能:Agent的"行动手脚"
这是Agent实现价值落地的关键。
包括:
• 工具调用与API集成:通过MCP等协议调用搜索引擎、数据库、业务系统 API。比如数据分析Agent调用SQL接口查询销售数据。
• 代码生成与执行:自主编写、调试代码完成任务。比如科研辅助Agent生成 化学模拟代码。
• 物理/虚拟环境操作:控制机械臂、IoT设备,或在VR/AR环境中完成交互。比 如工业机械臂的精准抓取。
学习进化技能:Agent的"成长引擎"
这是Agent适应复杂场景的核心支撑。
包括:
• 强化学习:通过环境交互反馈优化行为策略。比如自动驾驶Agent优化路径 规划。
• 迁移学习:将A场景技能迁移至B场景,减少训练数据需求。比如将电商客服 技能迁移至金融客服场景。
• 元学习:快速掌握全新技能,提升未知环境适应能力。比如科研Agent快速学 习新领域文献分析方法。
技术基础
支撑Agent Skills实现的关键技术,我挑几个重要的说说。
自然语言处理(NLP)
这是Agent与人类沟通的基础。包括意图识别、语义理解、多轮对话等能力。
强化学习(Reinforcement Learning)
Agent通过与环境的交互,从反馈中学习最优策略。这在决策规划技能中特别重 要。
计算机视觉(Computer Vision)
让Agent能够"看见"世界,识别图像、视频中的信息。这在工业、医疗等场景中 很关键。
知识图谱与检索增强生成(RAG)
这两者结合起来,让Agent能够快速检索和应用领域知识。
我记得2025年有篇文章提到,通过RAG+Agent Skills的组合,可以将复杂问题的解决效率提升50%以上。这个数字让我有点意外,但细想也合理,因为精准的知识检索+标准化的执行流程,确实能大幅减少试错成本。

代码执行与脚本引擎
Agent Skills支持在Skill文件夹中包含Python、Shell等可执行脚本。Agent可以根据任务需要,动态执行这些脚本。
这在需要确定性计算的场景中特别有用。比如排序、数据处理这些任务,用代码执行比用LLM生成要高效得多,而且结果更可靠。
应用案例
我找了三个不同领域的实际案例,看看Agent Skills是怎么落地的。
案例1:PDF文档处理
这是Anthropic官方提到的例子。
Claude本身已经很擅长理解PDF内容了,但在直接操作PDF(比如填写表单)方面 有局限。
通过构建一个PDF Skill,可以给Claude这些新能力:
• 提取PDF表单字段
• 自动填写表单
• 输出填写后的PDF文件
这个Skill包含了详细的指令文档、Python脚本(用于读取PDF和提取表单字 段)、参考文档(表单填写规范)。
用户只需要说"帮我填一下这份申请表",Agent就会自动调用PDF Skill,完成整 个填写流程。
案例2:企业知识库问答
某大型企业构建了一个内部知识库问答Agent。
他们把企业知识库按领域分成多个Skills:财务制度、人事政策、技术规范 等。
当员工问"报销流程是什么"时,Agent会:
1. 识别关键词"报销"
2. 加载"财务制度Skill"的元数据
3. 根据需要,动态加载制度文档中关于报销的部分
4. 提取关键信息,生成回答
这种方式比传统把整个知识库塞进Context的模式,Token消耗降低了70%,而且 回答更精准。
案例3:代码开发助手
在Claude Code中,Agent Skills被大量使用。
比如有个"代码审查Skill":
// markdown
---
name: "code-review"
description: "对代码进行专业审查,检查安全性、性能、可读性"
---
当开发者提交代码时,Agent会自动加载这个Skill,按照预定义的审查标准进行 检查:
• 是否存在安全漏洞
• 代码风格是否一致
• 性能是否有优化空间
• 是否缺少单元测试
这种标准化的审查流程,比人工审查效率高了很多。而且因为是Skill,可以跨 项目复用,团队只需要维护一套标准即可。
发展趋势与挑战
我看了很多资料,发现Agent Skills有几个明显的发展趋势:
1. 技能经济(Skill Economy)的形成
未来可能会出现技能交易平台,领域专家可以把自己的独门方法封装成Skill, 出售给需要的人。企业也可以建立内部技能库,新人直接复用熟练员工的能力。
这个想法挺有意思的。以前我们说"代码复用",以后可能是"技能复用"。
2. 多Agent协作网络
未来的AI应用将不再是单一Agent的天下,而是多Agent协作的网络。
通过A2A(Agent-to-Agent)协议,不同的Agent可以互相发任务、协作、分工, 共同完成复杂的任务。
3. 自主学习与进化
未来的Agent将不再局限于开发者预设的工具。它们将具备:
• 编写工具的能力:Agent发现自己解决不了问题,现场写一段Python 代码作为新工具
• 检索工具的能力:从拥有成千上万个API的工具库中,动态检索出当前 需要的工具
这个方向Anthropic已经在探索了,他们在官方文档里提到,未来想让 Agent能够"创建、编辑、评估Skills"。
跨平台标准化
Agent Skills正在成为一个开放标准。现在Claude.ai、Claude Code、Cursor 等平台都支持了。
SkillsLM这个工具想成为AI Agent时代的npm,打通9大主流平台的技能管 理。如果这个愿景实现,那技能的复用性会大幅提升。
面临的挑战
当然,也不是没有挑战。我看到了几个比较突出的问题:
1. 安全性问题
既然Agent可以自主调用工具、执行脚本,那恶意Skills就可能引入安全漏 洞。
Anthropic在文档里提到了这个问题。他们通过allowed-tools白名单限制技 能可调用的工具,提供安全编码环境。
但这个问题还会长期存在,需要更好的沙箱机制和权限控制。
2. 技能质量参差不齐
随着技能生态的发展,可能会出现大量质量不一的Skills。
这需要建立技能评估体系,包括:
• 功能性测试:技能是否能完成任务
• 性能测试:执行效率如何
• 安全性测试:是否有安全漏洞
• 可靠性测试:边界情况处理
1. 认知负担
对于开发者来说,理解Agent Skills的概念、设计原则、最佳实践,还是有一定 门槛的。
Anthropic在文档里强调"Building a skill for an agent is like putting together an onboarding guide for a new hire"。这个类比很好,但"写入职 指南"这件事本身就不简单。
2. Token成本与性能权衡
虽然Agent Skills通过"渐进式披露"降低了Token消耗,但在复杂任务中,加载 多个Skills和Reference文档,仍然可能造成较高的成本和延迟。
这需要更智能的Skill加载策略和缓存机制。
我的思考
写到这里,我想聊聊自己的感受。
其实刚开始接触Agent Skills的时候,我有点不以为然。不就是封装技能吗?这东西好像以前也有类似的概念。
但越深入了解,我越觉得这是一个重要的范式转移。
从"提示词工程"到"技能工程",这个变化不是简单的名词替换。
提示词工程关注的是"如何让模型理解你的意图",而技能工程关注的是"如何组织、封装、复用能力"。
前者更多是"沟通技巧",后者是"架构设计"。
我记得有人说过,软件工程的发展,就是不断抽象和复用的过程。从机器码到汇编,到高级语言,到框架,到微服务。
AI Agent的开发,可能也在走这条路。
Agent Skills,可能是AI Agent时代的"模块化设计"。
最后
2025年我们见证了AI技术的很多突破:DeepSeek的模型架构创新、Claude Code的强大能力、Copilot的深度集成。
但真正改变应用形态的,往往不是模型本身的进步,而是开发范式的创新。
Agent Skills可能就是这样一个东西。
它不是让Agent变得更聪明,而是让Agent变得更可复用、更可维护、更可规模化。
这让我想到Paul Graham说过的一句话:
"真正的大公司不是靠大技术建立的,而是靠让技术变得可用。"
Agent Skills可能正在让AI Agent变得"可用"。
你对Agent Skills有什么看法?欢迎在评论区聊聊你的想法。
更多推荐


所有评论(0)