Anthropic发布Agent Skills开放标准,定义智能体"能力"单元,与MCP工具、A2A协作形成互补。其渐进式披露特性解决上下文限制,结合LLM与确定性代码执行。通过将业务流程打包成可复用技能,降低经验注入大模型的技术复杂度。Agent Skills标志着智能体开发从单体架构向微服务、组件化转型,未来竞争将围绕能力单元生态展开,为AI世界定义"操作系统层"和"包管理协议"。

前排提示,文末有大模型AGI-CSDN独家资料包哦!

前言

美国时间 2025 年 12 月 18 日,Anthropic 正式宣布将 Agent Skills 发布为开放标准。去年刚写了篇关于 MCP 的文章,今年 Anthropic 发布了 Agent Skills,迫不及待的试一试,到底有没有宣发的那么强悍。

Agent Skills 是什么

This led us to create Agent Skills: organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks.

https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

官网的介绍就是这样,说到 Agent Skills,就一定要和 MCP,A2A 对比,这样才能更好理解 Agent Skills。
引用:Anthropic 工程团队博客 https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

首先,抛出结论:Agent Skills 定义“能力”,MCP 提供“工具”,A2A 实现“协作”。

对比

核心关系

你可以将这三者理解为构建一个“智能体公司”的不同部门:

  • • Agent Skills 像是公司的各个专业员工,他们各自掌握了完成特定任务(如写代码、做设计、分析数据)的完整方法和流程。

  • • MCP 像是公司的统一后勤与工具库。无论哪个员工需要工具(如使用数据库、调用某个软件),都通过标准流程从这个库中领取,无需自己再造。

  • • A2A 像是公司内部的协作通讯协议和会议制度。当一项复杂任务需要多个部门的员工(即多个智能体)合作时,他们依据这套规则进行沟通、同步进度和交付成果。

优势

Agent Skill 的思路有别于 MCP 的开发模式,从官网来看,有几个特点可以关注。

特点一:渐进式披露 (Progressive Disclosure)

渐进式披露是Agent技能设计中的核心原则,它让智能体的技能体系既灵活又可扩展。就像一本结构清晰的说明书,先给目录,再分章节,最后附上详细附录——技能的设计也是如此,让Claude只在需要时才加载对应的信息。

当智能体具备文件系统和代码执行工具时,在处理特定任务时,无需一次性将某个技能的全部内容读入上下文窗口。这意味着,一个技能所能涵盖的信息量实际上是没有上限的。这相当于,你可以给一个 Agent 装备 1000 个,甚至无限技能(从写 SQL 到 查数据),只占用极少的上下文(Context),只在执行时才调用相关工具。这完美解决了长期以来困扰开发者的Token 浪费上下文干扰问题。

特点二:LLM不是万能的

大语言模型虽然擅长处理多种任务,但有些操作还是交给传统代码来执行更合适。比如,让模型通过逐词生成来排序一个列表,远比直接运行排序算法的消耗大得多。除了效率问题,很多实际应用还需要确定性的可靠结果——而这只有代码才能保证。

Agent Skills提出,很多确定性的事情或者输入输出很清晰的事情,是可以拆解为traditional code执行,甚至执行的效果会更好,这也是Agent Skills的优势,它只会在具体执行到的时候触发(Claude can run this script without loading either the script or the PDF into context.)不用像传统Agent方式,全部输入到prompt上下文。

引用:Anthropic 工程团队博客https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

技能会在上下文窗口中通过系统提示符触发

落地

大概的Skill结构,如下

核心是需要写SKILL.md
必需字段:

  • • name - 技能的名字(小写字母、数字、下划线)
  • • description - 技能功能和使用场景描述,帮助AI判断何时使用

实战一:自然语言查数

背景

大数据存在大量数据分析场景,例如财务、A/B 实验报告等。Agent Skills 可将流程性的知识,打包成可组合、可复用的技能。我们不需要造更多的 Agent,只需动态加载技能,就可以解决特定领域的问题。

案例

我们可以将财务Agent和A/B实验报告Agent的自然语言查数,提炼为如下步骤:

    1. 理解用户意图:选择合适的数据集信息(财务、A/B实验报告(订单、用户))
    1. 加载领域知识:读取相关场景的元数据、业务知识等信息
    1. 加载SQL:生成知识,识别所使用的数据库信息、及相关SQL规范
    1. 生成并执行 SQL:选取hive.py & doris.py 工具,查询结果

现在,我们将这一套流程打包成技能,其结构如下:

接下来,我们在 Agent 中注册这个技能,就可以快速实现自然语言查数的能力。

财务

实验报告

将自然语言查数打包成技能,后续各业务Agent不再需要定制自然语言查数能力,只需要做好相关领域知识的维护,就能快速解决查数问题,而且,整个流程更容易治理和迭代。

实战二:指标归因分析

背景

大数据存在海量的数据,数据需做一些归因分析,可以进一步发挥数据价值。

skills能力

核心流程:

    1. 理解用户意图:选择合适的SKILL
    1. 加载领域知识:读取相关场景的元数据、业务知识等信息
    1. 解析scripts:识别提供的python工具包并使用
    1. 判断是否继续:判断是否解决问题并调用其他工具

核心结果:

第一阶段分析,分析结束后可衔接其他技能 第二阶段分析,数据视角更深入

注意:文章内容均为测试环境测试数据

    1. 业务经验抽象的质量,决定了Agent能力的上限
    1. Agent Skills方案,降低了把业务经验注入到大模型的技术复杂度
    1. scripts是双刃剑,为agent扩展能力边界的同时,也带来较大安全隐患,请谨慎使用外部Skills
核心业务指标分析逻辑 SKILL.md原文件
---name: 核心业务指标分析逻辑description: 分析指标1指标及其关联指标的周环比变化,识别影响因子和异常原因。使用场景:当用户需要分析业务指标变化、查找指标下降原因、进行指标根因分析时。---# 核心业务指标分析逻辑分析指标1指标及其关联指标的周环比变化,识别影响因子和可能原因。## 分析流程### 1. 获取指标1周环比数据调用 `scripts/query_demo.py` 获取指标1指标的周环比数据:python scripts/query_demo.py 指标1 --json返回数据包含:- 今日日期、上周同期日期- 今日指标值、上周同期指标值- 变化率(周环比)### 2. 判断是否需要深入分析**如果指标1环比下降**,继续执行以下步骤:#### 2.1 获取关联指标数据调用 `scripts/query_demo.py` 获取以下指标的周环比数据:- 指标1- 指标2- 指标3- 指标4- 指标5python scripts/query_demo.py <指标名称> --json#### 2.2 分析影响因子对比各指标的变化率,识别:- 哪个指标对指标1影响较大(变化率最显著)- 指标间的关联关系- 可能的原因分析### 3. 获取节假日信息(可选)如需考虑节假日因素,调用 `scripts/holiday.py`:python scripts/holiday.py返回指定日期范围内的工作日和节假日信息,用于判断指标变化是否受节假日影响。### 4. 进行OLAP下钻分析(可选)对于影响较大的指标,可进行OLAP下钻分析以识别细分维度的贡献度:参考 `OLAP下钻分析` 技能,使用该技能进行多维度下钻分析。## 支持的指标- 指标1(核心指标)- 指标2- 指标3- 指标4- 指标5## 分析输出建议分析结果应包含:1. **核心指标状态**   - 指标1周环比变化   - 变化趋势(上升/下降/持平)2. **关联指标分析**(如指标1下降)   - 各关联指标的周环比数据   - 影响因子排序   - 指标关联性分析3. **可能原因**   - 基于数据变化的可能原因推断   - 节假日因素(如适用)   - 其他外部因素考虑4. **下钻分析结果**(如适用)   - 细分维度的贡献度分析   - 关键维度识别## 使用示例**示例:分析指标1下降原因**# 1. 获取指标1数据python scripts/query_demo.py 指标1 --json# 2. 如果下降,获取关联指标python scripts/query_demo.py 指标2 --jsonpython scripts/query_demo.py 指标3 --jsonpython scripts/query_demo.py 指标4 --jsonpython scripts/query_demo.py 指标5 --json# 3. 检查节假日因素python scripts/holiday.py# 4. 对影响最大的指标进行下钻分析(如指标2)

展望

Agent Skills 并非一个简单的“新功能”,而是从单体架构到微服务,从过程式脚本到组件化框架这一转型的标准化接口。它的核心价值,在于为“模型智能”的工程化落地,定义了一种可组合、可复用的 “能力单元” 设计范式。

未来的竞争维度将发生根本变化:问题将从 “你的单体模型(巨石应用)性能多强?” ,转向 “你的‘包管理器’(Skill 生态)有多丰富、可靠和高效?” 。拥有最强大模型,但缺乏易用、标准化能力接口的公司,可能会像拥有最强单核CPU但缺乏操作系统和软件生态的厂商一样,在真正的应用战场中失势。

Skill 规范,正是在尝试为 AI 世界定义那个至关重要的 “操作系统层”和“包管理协议”。

读者福利:倘若大家对大模型感兴趣,那么这套大模型学习资料一定对你有用。

针对0基础小白:

如果你是零基础小白,快速入门大模型是可行的。
大模型学习流程较短,学习内容全面,需要理论与实践结合
学习计划和方向能根据资料进行归纳总结

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

请添加图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

这里我们能提供零基础学习书籍和视频。作为最快捷也是最有效的方式之一,跟着老师的思路,由浅入深,从理论到实操,其实大模型并不难

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐