Claude Skill创造者：停止造Agent，造Skill

Skill = 一个带有指令、脚本与资源的文件夹Claude 在需要时自动加载，使其具备完成某类专业任务的能力。假设我们要让 Claude 自动读取上市公司 PDF 财报，提取关键指标并生成中文摘要。维度传统 Agent能力构建重写 Agent新增 Skill 文件夹知识沉淀一次性 prompt可版本化、可测试、可复用协作门槛工程师专属产品/运营/领域专家均可参与扩展成本高（耦合逻辑）极低（cp

golang学习记

795人浏览 · 2025-12-22 05:00:00

golang学习记 · 2025-12-22 05:00:00 发布

🎯 引言：Agent 的“高智商困境”

当前的 AI Agent 普遍面临一个悖论：

智商 300，专业度 0。

就像 Anthropic 工程师 Barry Zhang 所比喻的：

“你希望谁帮你报税？是智商 300 的数学天才 Mahesh，还是经验丰富的税务专家 Barry？”

Agent 能写诗、能编程、能推理，但在特定领域任务（如财务建模、合规审查、临床试验分析）上，缺乏可持续、可复用、可验证的程序性专业知识。它记不住“上一次怎么做的”，也无法向“未来的自己”传承经验。

为破解这一困局，Anthropic 在 2025 年 10 月推出 Claude Skills —— 一种全新的 Agent 能力扩展范式，主张：

🛑 Stop Building Agents.
✅ Start Building Skills.

🧩 什么是 Skill？—— 文件夹即能力

Skill ≠ Function / Tool / Plugin。

官方定义简洁而有力：

Skill = 一个带有指令、脚本与资源的文件夹
Claude 在需要时自动加载，使其具备完成某类专业任务的能力。

✅ Skill 的本质特征

特性	说明
文件系统原生	本质是普通文件夹，含 `.py`, `.sh`, `skill.md`, `config.json` 等，可直接 `git add`
可组合 & 可复用	多个 Skill 可并行加载；企业可构建内部 Skill 库
渐进式披露（Progressive Disclosure）	Agent 初次只读 `skill.md` 元数据；调用时才加载完整内容 → 节省上下文
版本可控	支持 semver 语义化版本，便于灰度发布与回滚
非程序员友好	财务、法务、HR 也能用 Markdown + 模板创建领域 Skill

🌟 技术亮点：为何 Skill 是“下一代工具调用”？

传统 Function Calling（如 OpenAI Tool Calling）存在三大痛点：

问题	Skill 的解法
🔒 工具定义需硬编码进 prompt	→ 技能自包含：工具脚本 + 使用文档 = 单一文件夹，Agent 按需加载
🧠 占用宝贵上下文窗口	→ 仅元数据预加载：`skill.md` 极简描述，完整逻辑延迟加载
🛠️ 无法修改/调试/测试	→ 代码即工具：Agent 可读、写、改 Skill 中的脚本，实现“自我进化”

💡 举例：若让 Agent 多次为 PPT 加统一动画，传统方式每次重写脚本；而 Skill 允许它将脚本存入 ./skills/ppt-styler/，下次直接调用，结果一致、效率翻倍。

📦 Skill 的三大类型与生态

短短 5 周内，Skills 生态已形成清晰分层：

1️⃣ 基础技能（Foundational Skills）

→ 提供通用能力扩展

文档技能：生成/编辑 Word、PPT、PDF
编码技能：支持特定框架（如 PyTorch Lightning 模板生成）
推理技能：形式化验证、逻辑链构建

2️⃣ 第三方技能（Third-Party Skills）

→ 由生态伙伴为自家产品构建

Browserbase + Stagehand：高可靠浏览器自动化
Notion Skills：理解用户工作区结构，跨页面搜索/聚合
Slack/Microsoft Teams Skills：自动归档会议纪要 → Jira ticket

3️⃣ 企业定制技能

→ 内部知识资产化

财报分析模板（含合规校验逻辑）
客户支持 SOP 脚本（含敏感词过滤）
代码审查规则（集成 SonarQube 规则集）

📊 据披露：《财富》100 强中多家企业已将核心业务流程封装为 Skills，新员工 Agent 入职即具备“老员工经验”。

🏗️ 技术架构：Agent 的“操作系统”模型

Anthropic 提出全新 Agent 架构四层模型，Skill 位于核心应用层：

层级	类比	职责
Model	CPU	提供原始推理能力（如 Claude 3.5）
Agent Runtime	OS	管理文件系统、代码执行、上下文调度（Bash + FS + Python env）
MCP Servers	外设驱动	连接外部系统（数据库、API、搜索引擎）
Skills Library	应用软件	编码领域知识，决定 Agent “能不能做好某件事”

🔑 关键洞见：真正价值不在模型本身，而在模型之上构建的应用层。

🧪 实战示例：构建一个「股票财报摘要」Skill

假设我们要让 Claude 自动读取上市公司 PDF 财报，提取关键指标并生成中文摘要。

步骤 1：创建 Skill 文件夹结构

skills/
└── stock-report-analyzer/
    ├── skill.md              # 元数据 & 使用说明
    ├── main.py               # 主逻辑（PDF 解析 + 摘要生成）
    ├── requirements.txt      # 依赖（pdfplumber, langchain, etc.）
    └── templates/
        └── summary_zh.jinja2 # 中文报告模板

`skill.md`

# 股票财报摘要分析器
**作者**：Finance Team  
**版本**：1.2.0  
**描述**：  
  从上市公司 PDF 财报中提取营收、净利润、毛利率等核心指标，  
  生成符合 SEC 规范的中文摘要报告。支持 A 股/H 股/美股。

**触发条件**：  
  - 用户提及“财报”、“年报”、“季报”、“financial report”  
  - 上传 .pdf 文件且文件名含 “annual” 或 “quarterly”

**输入**：  
  - `pdf_path: string` —— 财报 PDF 路径  
  - `lang: "zh" | "en" = "zh"` —— 输出语言

**输出**：  
  - 结构化 JSON + 渲染后的 Markdown 报告

步骤 2：Agent 自动调用（无需硬编码！）

用户上传 AAPL_2024_Q3.pdf 并提问：

“请用中文总结这份财报亮点。”

Claude：

扫描已加载 Skills，匹配到 stock-report-analyzer
读取 skill.md 确认适用性
调用 main.py --pdf AAPL_2024_Q3.pdf --lang zh
返回渲染报告 + 数据 JSON

→ 全程无需修改 Agent 核心逻辑。

🔮 未来：Skills 将开启 Agent 的“持续学习”时代

✅ 已实现

Skill Creator Skill：Claude 可自助创建新 Skill
Git 集成：团队协作开发 & CI/CD 测试
非技术人员低代码构建（Notion 表单 → Skill）

🚧 规划中

方向	说明
Skill Testing Framework	单元测试 + 输出断言（如“毛利率必须为 0~1 之间”）
Skill Dependency Graph	A Skill 依赖 B Skill，自动解析加载
Skill Marketplace	官方/社区共享平台（类似 npm for Agent）
Agent Memory → Skill 化	将成功经验自动沉淀为可复用 Skill

🌟 Barry 的愿景：
“Claude 在与用户合作的第 30 天，要比第 1 天更聪明。”
而 Skill，正是实现这一目标的最小可积累知识单元。

📌 总结：为什么 Skills 是范式转移？

维度	传统 Agent	Skill-Based Agent
能力构建	重写 Agent	新增 Skill 文件夹
知识沉淀	一次性 prompt	可版本化、可测试、可复用
协作门槛	工程师专属	产品/运营/领域专家均可参与
扩展成本	高（耦合逻辑）	极低（`cp -r` 即可复用）

🎯 最终隐喻：
模型是 CPU，Runtime 是 OS，而 Skill —— 是真正让用户愿意付费的“应用软件”。

未来，技能像软件一样：测试、评估、版本控制和依赖管理，Skills 就像应用软件，编码专业知识和独特视角，让 AI 真正“有用”

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

DDIA第一章：吃透数据系统架构的核心逻辑

我们常说“数据驱动业务”，但首先要分清两类核心应用：计算密集型和数据密集型，两者的核心挑战天差地别。计算密集型：核心瓶颈是算力，比如AI训练、科学计算，拼的是CPU/GPU性能；数据密集型：核心瓶颈是数据本身，比如电商、社交、支付系统，核心挑战是存储海量数据、保障数据一致性、应对高并发读写、实现系统高可用。数据库：持久化存储数据，保证后续可检索；缓存：记住昂贵操作结果，加速高频读取；搜索索引：支持