什么是agent-skills?

        上周我在研究Claude Code的时候,突然发现Anthropic搞了个很有意思的东西——Agent         Skills。

        第一眼看到这个名字的时候,我有点困惑。这不就是给AI Agent加点技能包吗?这有什么好单独拎出来说的?但当我深入去了解之后,我发现这个事情远比我想象的要重要得多。

今天作为AI Native Coder,我想聊聊这个可能改变AI Agent开发范式的技术。

为什么是Skills?

先说个背景。

        在2023-2024年的时候,大家都在疯狂做Agent。我也是那时候开始接触Claude Code、AutoGPT这些工具的。但很快就发现一个问题:每个Agent都得单独开发,代码没法复用,维护成本特别高。

        我记得那时候有个项目,我给团队做了个代码审查的Agent。后来要做个技术文档生成的Agent,结果发现很多能力是重复的。但因为是硬编码在各个Agent里的,只能重新写。

        这种重复造轮子的感觉,特别难受。

        2025年10月,Anthropic推出了Agent Skills。我去看了他们的官方文档,一下子就明白了他们的想法。https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

他们把Agent Skills定义为"用文件和文件夹构建专业Agent的新方式"。

听起来很简单,但这个"文件和文件夹"的设计,其实是个挺聪明的决定。

核心概念:什么是Agent Skills?

        从定义上来说,Agent Skills是智能体为完成特定任务而具备的能力集合。

但这个定义太抽象了。我换个更直白的说法:

        如果说大模型是Agent的"大脑",那Skills就是Agent的"手脚"和"经验库"。

        没有Skills的Agent,只是一个博学的空谈家——它能理解你要什么,但没法真 的去执行。有了Skills,它才能真正和数字世界交互,从"处理文本"进化到"解 决问题"。

        在Anthropic的实现里,一个Skill本质上就是一个文件夹,核心是一个 SKILL.md文件。

        我举个真实的例子。

        假设你要给Agent加一个"PDF表单填写"的技能。传统的做法可能是写一大段prompt塞进系统提示词里。但Agent Skills的做法是创建一个pdf-form-filler文件夹,里面放个SKILL.md:

// markdown
---
name: "PDF Form Filler"
description: "提取PDF表单字段并完成填写,输出填写后的PDF文件"
version: "1.0.0"
---

这个技能用于处理PDF表单...

这个设计有个很重要的原则,叫"渐进式披露"(Progressive Disclosure)。

什么意思呢?

        第一层:Agent启动时,只加载所有Skills的name和description(元数据),占 用极少token。

        第二层:当任务需要某个Skill时,才加载该Skill的完整SKILL.md内容。

        第三层:执行过程中如果需要,再加载该Skill关联的reference文档或脚本。

        我实测过,在处理长链条业务流程时,这种架构能将上下文Token消耗降低60%-80%。这个数据还挺猛的。

为什么这么高呢?因为传统模式要把所有规则常驻在Context里,而Agent Skills是"用多少加载多少"。

Agent vs Skills的关系

我觉得这个关系可以这样理解:

Agent是"数字人",Skills是"专业能力"。

脱离Skills的Agent,只是具备基础推理能力的"空壳"。而优质的Skills体系, 能让Agent从"被动响应指令"升级为"主动解决问题"。

这就是为什么Meta在2025年收购Manus之后,重点强化Skills生态。他们看 中的就是这个能力:通过Skills体系,让通用Agent快速变成专业Agent。

三大核心特征

        自主性

        自主性是Agent Skills最核心的特征。

        传统的工具调用模式,需要人类明确指示"调用什么工具"。但Agent Skills让AI能够自主判断"需要什么技能",并自动调用相关工具完成任务。

举个例子。

如果你用传统模式写个"查询天气"的功能,可能是这样的:

def get_weather(city):
    # 调用天气API
    return weather_data

但在Agent Skills体系里,你只需要定义Skill:

// markdown
---
name: "weather-query"
description: "查询指定城市的实时天气和未来3天预报"
---

        Agent会根据用户的"北京明天天气怎么样"这个输入,自主判断需要调用weather-query这个Skill,然后执行查询。

        这种从"被动执行"到"主动决策"的转变,是AI从"助手"升级为"员工"的关键标志。

        适应性

        适应性体现在两个层面。

                场景层面:同一个Agent可以根据任务不同,动态加载不同的Skills。客服场景 加载"退换货处理"、"投诉处理"这些技能;开发场景加载"代码审查"、"单元测 试"这些技能。

                数据层面:通过Reference机制,可以在需要时加载庞大的领域知识库。比如财 务制度、法律条款这些长文档,不是常驻Context,而是"提到'报销'时才加载制 度文档"。

        这种设计让Agent能够快速适应不同场景,而且不会因为知识库太大而影响性能。

        模块化与可复用性

        这是我最喜欢的特性。

        Agent Skills采用标准化的文件夹结构,每个技能本质上是一个包含SKILL.md文件的文件夹,内部整合"指令文档、可执行脚本、配套资源"三大要素。

        这意味着什么?

        意味着只要平台支持Agent Skills标准,就能直接调用文件夹内的所有能力,实现"一次开发,多端复用"。

        我查了一下,现在Claude.ai、Claude Code、Claude Agent SDK、Claude Developer Platform都已经支持Agent Skills了。

        SkillsLM这个工具甚至想成为AI Agent时代的npm,一键打通9大主流平台的技能管理。这个想法挺有野心的。

分类体系

根据功能属性和应用层级,Agent Skills可以分为四大类。我结合实例来说明。

        基础交互技能:Agent的"沟通桥梁"

        这类技能的核心作用是实现Agent与人类、外部系统或物理环境的信息交互。

包括:

        • 自然语言处理(NLP):意图识别、语义理解、多轮对话。比如电商客服Agent 理解用户退换货需求。

        • 计算机视觉(CV):图像检测、目标识别、场景理解。比如工业运维Agent通 过图像识别设备异常升温。

        • 语音与传感交互:语音识别、合成、IoT传感器数据解析。比如智能家居 Agent通过语音指令控制设备。

        决策规划技能:Agent的"思考中枢"

        这部分是Agent的核心竞争力所在。

        包括三个能力模块:

  1. 目标解析与任务拆解:将模糊目标转化为可执行的子任务序列。比如面对" 组织跨部门季度总结会议"这个需求,Agent可以拆解为:

确定会议时间→筛选场地→准备材料→发送通知→安排记录。

        2. 风险评估与优先级排序:预判各子任务的难度、资源消耗、时间成本。比如 金融风控Agent会先筛选"高负债+无稳定收入"的高风险案例优先处理。

        3. 动态适配与纠错优化:当出现工具调用失败、数据异常、环境变化时,Agent 能快速调整策略。比如智能办公Agent发现会议室被占用时,自动筛选备选场 地。

        执行操作技能:Agent的"行动手脚"

        这是Agent实现价值落地的关键。

        包括:

        • 工具调用与API集成:通过MCP等协议调用搜索引擎、数据库、业务系统 API。比如数据分析Agent调用SQL接口查询销售数据。

        • 代码生成与执行:自主编写、调试代码完成任务。比如科研辅助Agent生成 化学模拟代码。

        • 物理/虚拟环境操作:控制机械臂、IoT设备,或在VR/AR环境中完成交互。比 如工业机械臂的精准抓取。

        学习进化技能:Agent的"成长引擎"

        这是Agent适应复杂场景的核心支撑。

        包括:

        • 强化学习:通过环境交互反馈优化行为策略。比如自动驾驶Agent优化路径 规划。

        • 迁移学习:将A场景技能迁移至B场景,减少训练数据需求。比如将电商客服 技能迁移至金融客服场景。

        • 元学习:快速掌握全新技能,提升未知环境适应能力。比如科研Agent快速学 习新领域文献分析方法。

技术基础

支撑Agent Skills实现的关键技术,我挑几个重要的说说。

        自然语言处理(NLP)

        这是Agent与人类沟通的基础。包括意图识别、语义理解、多轮对话等能力。

        强化学习(Reinforcement Learning)

        Agent通过与环境的交互,从反馈中学习最优策略。这在决策规划技能中特别重 要。

        计算机视觉(Computer Vision)

        让Agent能够"看见"世界,识别图像、视频中的信息。这在工业、医疗等场景中 很关键。

        知识图谱与检索增强生成(RAG)

        这两者结合起来,让Agent能够快速检索和应用领域知识。

        我记得2025年有篇文章提到,通过RAG+Agent Skills的组合,可以将复杂问题的解决效率提升50%以上。这个数字让我有点意外,但细想也合理,因为精准的知识检索+标准化的执行流程,确实能大幅减少试错成本。

        代码执行与脚本引擎

Agent Skills支持在Skill文件夹中包含Python、Shell等可执行脚本。Agent可以根据任务需要,动态执行这些脚本。

        这在需要确定性计算的场景中特别有用。比如排序、数据处理这些任务,用代码执行比用LLM生成要高效得多,而且结果更可靠。

应用案例

我找了三个不同领域的实际案例,看看Agent Skills是怎么落地的。

案例1:PDF文档处理

这是Anthropic官方提到的例子。

Claude本身已经很擅长理解PDF内容了,但在直接操作PDF(比如填写表单)方面 有局限。

通过构建一个PDF Skill,可以给Claude这些新能力:

提取PDF表单字段

自动填写表单

输出填写后的PDF文件

这个Skill包含了详细的指令文档、Python脚本(用于读取PDF和提取表单字 段)、参考文档(表单填写规范)。

用户只需要说"帮我填一下这份申请表",Agent就会自动调用PDF Skill,完成整 个填写流程。

案例2:企业知识库问答

某大型企业构建了一个内部知识库问答Agent。

他们把企业知识库按领域分成多个Skills:财务制度、人事政策、技术规范 等。

当员工问"报销流程是什么"时,Agent会:

1. 识别关键词"报销"

2. 加载"财务制度Skill"的元数据

3. 根据需要,动态加载制度文档中关于报销的部分

4. 提取关键信息,生成回答

这种方式比传统把整个知识库塞进Context的模式,Token消耗降低了70%,而且 回答更精准。

案例3:代码开发助手

在Claude Code中,Agent Skills被大量使用。

比如有个"代码审查Skill":

// markdown
---
name: "code-review"
description: "对代码进行专业审查,检查安全性、性能、可读性"
---

当开发者提交代码时,Agent会自动加载这个Skill,按照预定义的审查标准进行 检查:

是否存在安全漏洞

代码风格是否一致

性能是否有优化空间

是否缺少单元测试

这种标准化的审查流程,比人工审查效率高了很多。而且因为是Skill,可以跨 项目复用,团队只需要维护一套标准即可。

发展趋势与挑战

我看了很多资料,发现Agent Skills有几个明显的发展趋势:

        1. 技能经济(Skill Economy)的形成

        未来可能会出现技能交易平台,领域专家可以把自己的独门方法封装成Skill, 出售给需要的人。企业也可以建立内部技能库,新人直接复用熟练员工的能力。

        这个想法挺有意思的。以前我们说"代码复用",以后可能是"技能复用"。

        2. 多Agent协作网络

        未来的AI应用将不再是单一Agent的天下,而是多Agent协作的网络。

        通过A2A(Agent-to-Agent)协议,不同的Agent可以互相发任务、协作、分工, 共同完成复杂的任务。

        3. 自主学习与进化

        未来的Agent将不再局限于开发者预设的工具。它们将具备:

        • 编写工具的能力:Agent发现自己解决不了问题,现场写一段Python 代码作为新工具

        • 检索工具的能力:从拥有成千上万个API的工具库中,动态检索出当前 需要的工具

这个方向Anthropic已经在探索了,他们在官方文档里提到,未来想让 Agent能够"创建、编辑、评估Skills"。

跨平台标准化

        Agent Skills正在成为一个开放标准。现在Claude.ai、Claude Code、Cursor 等平台都支持了。

        SkillsLM这个工具想成为AI Agent时代的npm,打通9大主流平台的技能管 理。如果这个愿景实现,那技能的复用性会大幅提升。

面临的挑战

当然,也不是没有挑战。我看到了几个比较突出的问题:

        1. 安全性问题

                既然Agent可以自主调用工具、执行脚本,那恶意Skills就可能引入安全漏 洞。

                Anthropic在文档里提到了这个问题。他们通过allowed-tools白名单限制技 能可调用的工具,提供安全编码环境。

        但这个问题还会长期存在,需要更好的沙箱机制和权限控制。

        2. 技能质量参差不齐

                随着技能生态的发展,可能会出现大量质量不一的Skills。

                这需要建立技能评估体系,包括:

        • 功能性测试:技能是否能完成任务

        • 性能测试:执行效率如何

        • 安全性测试:是否有安全漏洞

        • 可靠性测试:边界情况处理

        1. 认知负担

        对于开发者来说,理解Agent Skills的概念、设计原则、最佳实践,还是有一定 门槛的。

        Anthropic在文档里强调"Building a skill for an agent is like putting together an onboarding guide for a new hire"。这个类比很好,但"写入职 指南"这件事本身就不简单。

        2. Token成本与性能权衡

        虽然Agent Skills通过"渐进式披露"降低了Token消耗,但在复杂任务中,加载 多个Skills和Reference文档,仍然可能造成较高的成本和延迟。

这需要更智能的Skill加载策略和缓存机制。

我的思考

写到这里,我想聊聊自己的感受。

        其实刚开始接触Agent Skills的时候,我有点不以为然。不就是封装技能吗?这东西好像以前也有类似的概念。

        但越深入了解,我越觉得这是一个重要的范式转移。

        从"提示词工程"到"技能工程",这个变化不是简单的名词替换。

        提示词工程关注的是"如何让模型理解你的意图",而技能工程关注的是"如何组织、封装、复用能力"。

        前者更多是"沟通技巧",后者是"架构设计"。

        我记得有人说过,软件工程的发展,就是不断抽象和复用的过程。从机器码到汇编,到高级语言,到框架,到微服务。

        AI Agent的开发,可能也在走这条路。

        Agent Skills,可能是AI Agent时代的"模块化设计"。

最后

2025年我们见证了AI技术的很多突破:DeepSeek的模型架构创新、Claude Code的强大能力、Copilot的深度集成。

但真正改变应用形态的,往往不是模型本身的进步,而是开发范式的创新。

Agent Skills可能就是这样一个东西。

它不是让Agent变得更聪明,而是让Agent变得更可复用、更可维护、更可规模化。

这让我想到Paul Graham说过的一句话:

"真正的大公司不是靠大技术建立的,而是靠让技术变得可用。"

Agent Skills可能正在让AI Agent变得"可用"。

你对Agent Skills有什么看法?欢迎在评论区聊聊你的想法。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐