一口气读懂 Agent Skills:40,000+ Claude Skills 背后的生态、机会与风险
从爆发式增长规律、全维度功能分类到多等级安全审计,这份数据驱动的研究,清晰呈现 Agent Skills 的社区生态和发展现状,既为技术落地研发、搭建平台提供了硬核量化参考,也让入门者能清晰看懂这一领域的真实全貌。
如果你最近关注过 OpenClaw,或者正在折腾 LLM Agent / Claude Skills / 自动化工作流,你大概率已经感受到一个明显的变化:Agent 正在从“会对话的模型”,变成“会干活的系统”。而在这个变化背后,一个概念正在迅速浮出水面—— Agent Skills,也称为Claude Skills。
它看起来像 Prompt,又不只是 Prompt; 它有点像 Tool,但又更像 Agent 时代的“智脑库 + 插件市场”。短短几周内,围绕 Skills 的生态突然爆发: OpenClaw Star 数暴涨、Claude Skills 被疯狂复刻、技能市场一天新增上千条…… 但热闹背后,疑问也随之而来:
- 市面上到底 有什么 Agent Skills?
- 大家都在写什么?真的有人在用吗?
- 技能是不是正在变得 越来越长、越来越乱?
- 更关键的是: 这些 Skills 安全吗?能放心交给 Agent 执行吗?
Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality 这篇文章基于一篇最新的 大规模实证研究,系统分析了 https://skills.sh 上 40,285 个公开 Agent Skills, 试图用数据而不是“感觉”,回答上面这些问题。我们将看到的不是零散 Demo,而是一张完整的生态快照:从 Skills 是什么、为什么需要 Skills、再到 Skills 正在把 Agent 带向哪里。
Agent Skills 是什么?为什么重要?
在进入数据之前,先统一一个直觉认知。Agent Skills 本质上是一种“可复用的 Agent 行为模块”:
- Metadata:定义 什么时候 该用
- Instructions:规定 具体怎么做
- Resources:封装 Prompt、流程、工具调用甚至脚本
你可以把它理解为:Agent 世界里的“程序函数 + 工作流模板 + 插件能力”。随着 Agent 开始处理 多步任务、工具调用、真实世界操作, 单纯靠 Prompt 已经开始显得笨重、不稳定、难维护。于是,Skills 出现了。
这篇文章做了什么?
论文并不是提出一个新框架,而是做了一件更“工程味”的事情:把整个 Agent Skills 生态拉出来,量了一遍。分析分为四个层次,从“表象”一路深入到“系统性问题”:
- Skill 的增长趋势:
这个生态到底发展得有多快?是不是泡沫? - Skill 的长度与重复情况:
Skills 会不会把 Prompt Budget 撑爆?大家是不是在反复造轮子? - Skill 的供需与社区现状:
谁在写?谁在用?供给和需求是否匹配? - Skill 带来的风险问题:
当 Skill 能执行命令、改文件、动资产,安全边界在哪里?
最后,再从这些数据中,抽象出 对未来 Agent 生态的启发。
核心发现速览
以下不是观点,而是对 40,285 个真实 Skills 的统计结果。
1️⃣ Agent Skills 增长极快,而且是“爆发式”的
- skills.sh 在 20 天内 从 2,000+ 暴涨到 40,000+
- 新技能的出现呈现明显的 “热点驱动型爆发”
- 与 OpenClaw 等 Agent 工具的社区热度高度同步
👉 这不是缓慢演进,而是一次基础设施级别的集体涌入
2️⃣ 将近一半的技能,其实是“重复的”
- 约 46% 的技能在“意图层面”高度重复
- 常见模式包括:
- 名字相同
- 描述轻微改写
- 模板式批量生成
👉 生态在快速堆数量,但能力多样性增长有限
3️⃣ 技能并没有你想象中那么“吃 Prompt”
- Skill 中位数长度 ≈ 1,400 tokens
- 90% 的技能 < 4,000 tokens
- 但存在极端长尾(最高 10 万+ tokens)
👉 大多数 Skill 是“可直接塞进上下文”的,但少数会成为系统负担
4️⃣ 技能内容高度集中,但使用情况并不一致
- 软件工程类技能占了一半以上 (代码生成、调试、基础设施)
- 信息检索 & 内容生成技能数量不多,但 下载量极高
- 出现明显对比:
- “写的人很多,但用的人不多”
- “写的人很少,但几乎人人都在用”
👉 这是一个典型的 供需错配型生态
5️⃣ 一个常被忽视的问题:Skill 的安全风险
- 约 40% 的技能 (L1 & L2) 涉及:
- 状态修改
- 文件操作
- 命令执行
- 9% 属于高危(L3),包括:
- Shell 执行
- 权限操作
- 资金 / 资产相关行为
👉 Skill ≠ Prompt,它是一种“可执行能力”
那这些分析又启发出哪些 Agent Skills 的潜在发展方向呢?点击 论文原文,获取更详实的分析和结论!
更多推荐
所有评论(0)