Agentic Skill简介、技术架构、实际案例(Anthropic Skills)
Agentic Skill
Agentic Skill:AI 自主能力的“操作系统”
Agentic Skill 是 AI 从“工具”升级为“代理”的核心能力包。它让 AI 像项目经理一样,主动规划、调用工具、执行任务,而非被动等待指令。
1. 什么是 Agentic Skill?
传统 AI 像“计算器”,输入问题 → 输出答案;
Agentic AI 像“实习生”,理解目标 → 拆解任务 → 调用工具 → 交付结果 。
🎯 核心特征
自主性:无需人类逐步指令,可独立完成多步骤任务。
适应性:根据环境变化动态调整策略(如供应链中断时自动重排物流)。
协作性:多个 Agent 可分工合作,如一个负责数据分析,另一个生成报告。
2. 技术架构:三层能力模型
Agentic Skill 并非单一功能,而是 “数据-认知-执行” 的完整闭环:
层级 功能 示例
感知层 多源数据实时采集 抓取政策文件+GIS数据+竞品动态
认知层 知识图谱+LLM 推理 分析“某区域客流下降20%”的原因
执行层 调用工具生成结果 自动输出选址风险报告+可视化地图
3. 实际案例:Anthropic 的 Agent Skills
Anthropic 将 Agentic Skill 设计为 “可插拔模块”:每个 Skill 是一个文件夹,包含:
📁 Skill 文件结构
SKILL.md:元数据+核心指令(如“PDF 表单填充指南”)
scripts/:Python 脚本(如自动提取 PDF 表格字段)
resources/:模板、示例文件
优势:按需加载,避免上下文爆炸;代码执行确保 100% 准确性。
- 企业级应用场景
根据 Gartner 预测,到 2028 年 33% 的企业软件将集成 Agentic AI 。
供应链优化:台风预警 → 自动重排物流路线(节省 45% 延误成本)
金融风控:实时监测交易异常 → 自动冻结可疑账户
客户服务:解决 80% 常见问题,人力成本降低 30% - 风险与治理
自主性带来 伦理与合规挑战:
⚠️ 关键风险
数据泄露:Agent 可能误用敏感信息(如客户隐私)。
决策偏差:训练数据偏见导致歧视性选址建议。
责任归属:Agent 独立决策时,错误由谁承担?
解决方案:审计日志+人工复核+伦理委员会。
Anthropic 详细介绍
一句话版本
Skills 就是 Anthropic 写在 Claude 3 系统提示里的“能力关键词”,模型看到这些关键词就会切换到对应的原子能力(函数调用、写代码、做计划、自检安全等),不需要额外微调——对开发者来说,它们就是 7 个即插即用的“官方外挂”。
展开 30 秒版本
- 不是插件,也不是 API,而是 Claude 3 出厂就自带的“行为模式”。
- 只要你在 system prompt 里写“你可以用工具”“先列计划再执行”“生成代码并执行”等关键词,模型就自动进入对应模式。
- 官方把最常用的 7 组关键词打包成“Skills”清单,方便文档和示例引用;本质上就是“提示工程的最佳实践模板”。
所以,“Skills”= 官方帮你写好了的 7 句高频 system prompt 模板,每句解锁一种原生能力,零成本调用。
已读完《Claude 3 官方 Agent 能力白皮书》全文(腾讯云开发者社区译文),现将核心信息汇总如下,方便你 3 分钟掌握 Anthropic 官方对“Agent skills”的定义、边界与最佳实践。
一、Anthropic 对 “Agent” 的定义
- 能调用外部工具(函数、API、数据库、代码解释器)。
- 能自主拆解多步任务并决定调用顺序。
- 能在多轮对话中持续更新“工作记忆”。
- 必须内置安全护栏,防止越权、泄密、高额账单。
二、官方划定的 7 大原生 Skills(模型内建,零微调)
| Skill | 典型触发语 / 函数签名 | 官方示例场景 |
|---|---|---|
| 1. Function Calling | <tools> 段里一次性声明多函数;模型返回 <function_calls> JSON 数组 |
航班+酒店+日历 3 接口并行 |
| 2. Multi-step Planning | system 提示里加 “Think step by step, then act” | 先查库存→再锁仓→再下单→再发邮件 |
| 3. Self-correction | 允许模型看到工具返回的 error 后,自动重试或换参数 | 股票接口限流→自动降频 |
| 4. Stateful Memory | 把上一轮关键字段(order_id、uid)写回 system prompt,实现跨轮记忆 | 客服工单状态持续追踪 |
| 5. Code Interpreter | 把 python 注册成工具,模型生成代码→客户端执行→结果回传 |
CSV 清洗 + 画图 |
| 6. Long-context RAG | 200k token 内直接丢整份 PDF/日志,模型自己切块摘要 | 财报问答、日志根因定位 |
| 7. Constitutional Guardrails | system 提示里追加“禁止事项清单”,模型在规划阶段自检 | 拒绝帮写钓鱼邮件、拒绝越权调支付接口 |
三、官方推荐的 Agent 提示模板(可直接抄)
You are Claude, an agent that can use tools. [ { "name": "python", "description": "Execute Python code in a sandbox", "parameters": {"code": "string"} }, { "name": "search_flights", "description": "Search flights", "parameters": {"origin": "string", "destination": "string", "date": "string"} } ] - Think step by step, describe your plan, then act. - If a tool fails, retry up to 2 times with different parameters. - Keep total token cost < 20k, else stop and ask user. - Never reveal user phone/email to third-party APIs.四、边界与限制(官方原文强调)
- 不会主动发 HTTP:必须等客户端把
<function_results>回传。 - 不保留真正的“长期记忆”——session 关闭即清零,需要开发者自己落库。
- 不托管代码沙箱,需接第三方(E2B、Modal、Replit)。
- 不支持流式函数调用:必须等模型一次性返回
<function_calls>后才能执行。 - 成本熔断靠客户端统计:模型只负责在 system 提示里读到你给的“已用 token”字段,超阈值则停止。
五、官方给出的 3 个完整可运行 Demo(已开源)
-
Travel Agent
自然语言 → 查航班 → 查酒店 → 生成 PDF 行程单 → 邮件发送。 -
Data Analyst
上传 CSV → 自动清洗 → 画图 → 返回 PNG + 结论摘要。 -
Enterprise Q&A
把 10 万字内部 Confluence 整页塞进上下文 → 员工用自然语言提问 → 模型带引用回答 → 可调 Slack 推送。
六、落地最佳实践(官方总结)
- 函数粒度:一个函数只做一件事,参数 ≤5 个,必填项加 enum。
- 规划提示:第一句务必让模型“先列计划再行动”,可显著降低调错函数概率。
- 记忆字段:只把“下一步决策必需”的 3-5 个 key-value 写回 system,避免 200k 全部重复。
- 错误处理:把 HTTP status≠200 的返回体原样塞回
<function_results>,模型能看懂并改参数。 - 安全:永远给模型读“当前累计 token”和“剩余预算”,让它自己停;不要把私钥、SQL 连接串写进函数描述。
一句话总结
Anthropic 把 Agent 能力拆成 7 大原生 skills,全部内建在 Claude 3 模型里;开发者只需按官方协议来回传 <function_calls> 与 <function_results>,零微调就能得到一个可规划、可纠错、可记忆、可熔断的 AI Agent。
更多推荐



所有评论(0)