一口气读懂 Agent Skills：40,000+ Claude Skills 背后的生态、机会与风险

从爆发式增长规律、全维度功能分类到多等级安全审计，这份数据驱动的研究，清晰呈现 Agent Skills 的社区生态和发展现状，既为技术落地研发、搭建平台提供了硬核量化参考，也让入门者能清晰看懂这一领域的真实全貌。

MaoziShan

416人浏览 · 2026-02-09 00:44:50

MaoziShan · 2026-02-09 00:44:50 发布

如果你最近关注过 OpenClaw，或者正在折腾 LLM Agent / Claude Skills / 自动化工作流，你大概率已经感受到一个明显的变化：Agent 正在从“会对话的模型”，变成“会干活的系统”。而在这个变化背后，一个概念正在迅速浮出水面—— Agent Skills，也称为Claude Skills。

它看起来像 Prompt，又不只是 Prompt；它有点像 Tool，但又更像 Agent 时代的“智脑库 + 插件市场”。短短几周内，围绕 Skills 的生态突然爆发： OpenClaw Star 数暴涨、Claude Skills 被疯狂复刻、技能市场一天新增上千条…… 但热闹背后，疑问也随之而来：

市面上到底 有什么 Agent Skills？
大家都在写什么？真的有人在用吗？
技能是不是正在变得 越来越长、越来越乱？
更关键的是： 这些 Skills 安全吗？能放心交给 Agent 执行吗？

Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality 这篇文章基于一篇最新的 大规模实证研究，系统分析了 https://skills.sh 上 40,285 个公开 Agent Skills，试图用数据而不是“感觉”，回答上面这些问题。我们将看到的不是零散 Demo，而是一张完整的生态快照：从 Skills 是什么、为什么需要 Skills、再到 Skills 正在把 Agent 带向哪里。

Agent Skills 是什么？为什么重要？

在进入数据之前，先统一一个直觉认知。Agent Skills 本质上是一种“可复用的 Agent 行为模块”：

Metadata：定义什么时候该用
Instructions：规定具体怎么做
Resources：封装 Prompt、流程、工具调用甚至脚本

你可以把它理解为：Agent 世界里的“程序函数 + 工作流模板 + 插件能力”。随着 Agent 开始处理多步任务、工具调用、真实世界操作，单纯靠 Prompt 已经开始显得笨重、不稳定、难维护。于是，Skills 出现了。

这篇文章做了什么？

论文并不是提出一个新框架，而是做了一件更“工程味”的事情：把整个 Agent Skills 生态拉出来，量了一遍。分析分为四个层次，从“表象”一路深入到“系统性问题”：

Skill 的增长趋势：
这个生态到底发展得有多快？是不是泡沫？
Skill 的长度与重复情况：
Skills 会不会把 Prompt Budget 撑爆？大家是不是在反复造轮子？
Skill 的供需与社区现状：
谁在写？谁在用？供给和需求是否匹配？
Skill 带来的风险问题：
当 Skill 能执行命令、改文件、动资产，安全边界在哪里？

最后，再从这些数据中，抽象出 对未来 Agent 生态的启发。

核心发现速览

以下不是观点，而是对 40,285 个真实 Skills 的统计结果。

1️⃣ Agent Skills 增长极快，而且是“爆发式”的

skills.sh 在 20 天内 从 2,000+ 暴涨到 40,000+
新技能的出现呈现明显的 “热点驱动型爆发”
与 OpenClaw 等 Agent 工具的社区热度高度同步

👉 这不是缓慢演进，而是一次基础设施级别的集体涌入

2️⃣ 将近一半的技能，其实是“重复的”

约 46% 的技能在“意图层面”高度重复
常见模式包括：
- 名字相同
- 描述轻微改写
- 模板式批量生成

👉 生态在快速堆数量，但能力多样性增长有限

3️⃣ 技能并没有你想象中那么“吃 Prompt”

Skill 中位数长度 ≈ 1,400 tokens
90% 的技能 < 4,000 tokens
但存在极端长尾（最高 10 万+ tokens）

👉 大多数 Skill 是“可直接塞进上下文”的，但少数会成为系统负担

4️⃣ 技能内容高度集中，但使用情况并不一致

软件工程类技能占了一半以上（代码生成、调试、基础设施）
信息检索 & 内容生成技能数量不多，但 下载量极高
出现明显对比：
- “写的人很多，但用的人不多”
- “写的人很少，但几乎人人都在用”

👉 这是一个典型的 供需错配型生态

5️⃣ 一个常被忽视的问题：Skill 的安全风险

约 40% 的技能 (L1 & L2) 涉及：
- 状态修改
- 文件操作
- 命令执行
9% 属于高危（L3），包括：
- Shell 执行
- 权限操作
- 资金 / 资产相关行为

👉 Skill ≠ Prompt，它是一种“可执行能力”

那这些分析又启发出哪些 Agent Skills 的潜在发展方向呢？点击论文原文，获取更详实的分析和结论！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI仿真人解说漫制作过程超细颗粒度解读

AI仿真人解说漫的制作,本质上是一个高度标准化、数据驱动、快速迭代的流程。核心要点:选题:基于数据,选择验证过的爆款题材文案:精心设计钩子,每5分钟一个高潮生成:批量生成,严格筛选,保证角色一致性剪辑:节奏控制,特效适度,付费点精准投放:小额测试,数据分析,押注爆款迭代:快速优化,3天一版,持续提升ROI不是技术(AI工具人人可用)而是:对爆款的嗅觉(选题能力)对节奏的把控(剪辑能力)对数据的敏感

2048 AI社区

Windows 下在 Trae 中接入 Unity-MCP：实现 AI 像 Coding 一样控制 Unity Editor（完整避坑指南）

Unity-MCP 是功能最强的开源 Unity MCP ServerAI 改代码AI 改 HierarchyAI 真实调用 Unity Editor APITrae + Unity-MCP 是目前最可控、最工程化的组合之一仿真交通 / 骑行 / 数字人大规模实验自动化👉这套架构非常值得投入。

2048 AI社区

【C++篇】map和set的使用

代码语言：javascriptAI代码解释set的声明如上，T就是set底层关键字(key)的类型。set默认要求T是支持比较大小的，如果不支持或者想按自己的比较方式走，可以传仿函数给第二个模板参数。set底层存储数据的内存是从空间配置器申请的，如果需要可以自己实现内存池，传给第三个参数一般情况下是不需要传后两个参数的set底层是用红黑树实现的，增删查的效率为O(logN),迭代器遍历走的是中序遍

2048 AI社区

所有评论(0)

查看更多评论

MaoziShan

@MaoziYa

已为社区贡献5条内容