如果你最近关注过 OpenClaw,或者正在折腾 LLM Agent / Claude Skills / 自动化工作流,你大概率已经感受到一个明显的变化:Agent 正在从“会对话的模型”,变成“会干活的系统”。而在这个变化背后,一个概念正在迅速浮出水面—— Agent Skills,也称为Claude Skills。

它看起来像 Prompt,又不只是 Prompt; 它有点像 Tool,但又更像 Agent 时代的“智脑库 + 插件市场”。短短几周内,围绕 Skills 的生态突然爆发: OpenClaw Star 数暴涨、Claude Skills 被疯狂复刻、技能市场一天新增上千条…… 但热闹背后,疑问也随之而来:

  • 市面上到底 有什么 Agent Skills
  • 大家都在写什么?真的有人在用吗?
  • 技能是不是正在变得 越来越长、越来越乱
  • 更关键的是: 这些 Skills 安全吗?能放心交给 Agent 执行吗?

Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality 这篇文章基于一篇最新的 大规模实证研究,系统分析了 https://skills.sh 上 40,285 个公开 Agent Skills, 试图用数据而不是“感觉”,回答上面这些问题。我们将看到的不是零散 Demo,而是一张完整的生态快照:从 Skills 是什么、为什么需要 Skills、再到 Skills 正在把 Agent 带向哪里。

Agent Skills 是什么?为什么重要?

在进入数据之前,先统一一个直觉认知。Agent Skills 本质上是一种“可复用的 Agent 行为模块”

Agent Skills调用场景 Agent Skills的基本要素
  • Metadata:定义 什么时候 该用
  • Instructions:规定 具体怎么做
  • Resources:封装 Prompt、流程、工具调用甚至脚本

你可以把它理解为:Agent 世界里的“程序函数 + 工作流模板 + 插件能力”。随着 Agent 开始处理 多步任务、工具调用、真实世界操作, 单纯靠 Prompt 已经开始显得笨重、不稳定、难维护。于是,Skills 出现了。

这篇文章做了什么?

论文并不是提出一个新框架,而是做了一件更“工程味”的事情:把整个 Agent Skills 生态拉出来,量了一遍。分析分为四个层次,从“表象”一路深入到“系统性问题”:

  1. Skill 的增长趋势
    这个生态到底发展得有多快?是不是泡沫?
  2. Skill 的长度与重复情况
    Skills 会不会把 Prompt Budget 撑爆?大家是不是在反复造轮子?
  3. Skill 的供需与社区现状
    谁在写?谁在用?供给和需求是否匹配?
  4. Skill 带来的风险问题
    当 Skill 能执行命令、改文件、动资产,安全边界在哪里?

最后,再从这些数据中,抽象出 对未来 Agent 生态的启发

核心发现速览

以下不是观点,而是对 40,285 个真实 Skills 的统计结果。

1️⃣ Agent Skills 增长极快,而且是“爆发式”的

Agent Skills增长趋势
  • skills.sh20 天内2,000+ 暴涨到 40,000+
  • 新技能的出现呈现明显的 “热点驱动型爆发”
  • OpenClaw 等 Agent 工具的社区热度高度同步

👉 这不是缓慢演进,而是一次基础设施级别的集体涌入

2️⃣ 将近一半的技能,其实是“重复的”

Agent Skills 重复程度
  • 46% 的技能在“意图层面”高度重复
  • 常见模式包括:
    • 名字相同
    • 描述轻微改写
    • 模板式批量生成

👉 生态在快速堆数量,但能力多样性增长有限

3️⃣ 技能并没有你想象中那么“吃 Prompt”

Agent Skills token长度分布
  • Skill 中位数长度 ≈ 1,400 tokens
  • 90% 的技能 < 4,000 tokens
  • 但存在极端长尾(最高 10 万+ tokens

👉 大多数 Skill 是“可直接塞进上下文”的,但少数会成为系统负担

4️⃣ 技能内容高度集中,但使用情况并不一致

Agent Skills 供需分析
  • 软件工程类技能占了一半以上 (代码生成、调试、基础设施)
  • 信息检索 & 内容生成技能数量不多,但 下载量极高
  • 出现明显对比:
    • “写的人很多,但用的人不多”
    • “写的人很少,但几乎人人都在用”

👉 这是一个典型的 供需错配型生态

5️⃣ 一个常被忽视的问题:Skill 的安全风险

Agent Skills risk
  • 约 40% 的技能 (L1 & L2) 涉及:
    • 状态修改
    • 文件操作
    • 命令执行
  • 9% 属于高危(L3),包括:
    • Shell 执行
    • 权限操作
    • 资金 / 资产相关行为

👉 Skill ≠ Prompt,它是一种“可执行能力”

那这些分析又启发出哪些 Agent Skills 的潜在发展方向呢?点击 论文原文,获取更详实的分析和结论!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐