AgentSkill + MCP 实现自助问题排查
本文以「卖场模式问题排查」为例,介绍如何通过 AgentSkill + MCP 将重复性问题排查工作自动化、标准化,让任何人都能快速上手解决问题。
AgentSkill + MCP 实现自助问题排查
作者负责维护的卖场项目日常问题比较多,本文以「卖场模式问题排查」为例,介绍如何通过 AgentSkill + MCP 将重复性问题排查工作自动化、标准化,让任何人都能快速上手解决问题。
一、背景:传统排查方式的痛点
1.1 真实场景
想象一下这个场景:你是卖场模式的开发同学,某天你收到这样一条消息:
“这个机子为什么检测不到资源?帮我看一下”
作为"老司机",你需要做以下事情:
📋 传统排查流程:
1️⃣ 打开 Postman / curl,调用资源下发接口,传入机型信息查询资源列表
→ 没有返回数据
2️⃣ 打开另一个接口,查询机型是否存在
→ 机型不存在,需要找用户要营销名
3️⃣ 调用添加机型接口,配置机型信息
→ 配置成功
4️⃣ 调用出货信息查询接口
→ 出货信息不存在
5️⃣ 调用出货信息配置接口
→ 配置成功
6️⃣ 告知用户重试
一个看似简单的问题,实际需要 5-6 次接口调用 + 多次信息确认。
1.2 这种方式的问题
| 问题 | 描述 |
|---|---|
| 🔁 重复劳动 | 同样的排查流程,每次都要手动执行一遍 |
| 📖 知识壁垒 | 只有熟悉业务的人才知道完整排查流程 |
| ⏰ 效率低下 | 每次排查都需要 10-30 分钟 |
| 📝 文档陈旧 | 排查文档经常更新不及时,新人无从下手 |
| 🤝 协作困难 | 其他团队遇到问题只能找"专家",形成瓶颈 |
更痛苦的是,这些问题每天都在重复发生。
二、解决方案:AgentSkill + MCP
2.1 核心思路
我们的目标是:把专家的排查经验"装进" AI,让每个人都能一键排查。
┌─────────────────────────────────────────────────────────────────┐
│ AgentSkill + MCP 架构 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ 用户 │
│ │ │
│ │ "帮我排查机子 XXX 为什么检测不到资源" │
│ ▼ │
│ ┌──────────────┐ │
│ │ AI Agent │ ◄─── 加载 SKILL.md(排查专家经验) │
│ │ (Cursor) │ │
│ └──────┬───────┘ │
│ │ │
│ │ 调用 MCP Tools │
│ ▼ │
│ ┌──────────────┐ HTTP ┌──────────────┐ │
│ │ MCP Server │ ◄────────────► │ 后端接口 │ │
│ │ (Python) │ │ (业务系统) │ │
│ └──────────────┘ └──────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
- MCP Server:封装业务接口为标准化工具,让 AI 能够调用
- AgentSkill (SKILL.md):定义排查流程和决策逻辑,赋予 AI “专家思维”
2.2 MCP:让 AI 拥有"操作能力"
MCP (Model Context Protocol) 让 AI 能够调用外部工具。我们把排查所需的接口封装成 MCP Tools:
| 工具名称 | 功能 |
|---|---|
get_rsc_list |
根据 IMEI 获取资源下发列表 |
get_rsc_id |
根据资源 ID 获取资源详情 |
add_device_model |
添加/查询机型 |
get_shipment_info |
获取出货信息 |
set_shipment_info |
配置出货信息 |
search_log_from_nuoa |
从日志平台查询日志信息 |
2.3 AgentSkill:让 AI 拥有"专家思维"
光有工具不够,AI 还需要知道什么时候用什么工具、如何判断结果。这就是 AgentSkill 的作用。
我们将排查专家的经验沉淀成一份 SKILL.md 文件:
## 排查流程 (SOP)
### 第一步:查询资源下发列表
操作:调用 get_rsc_list,传入 IMEI
判断逻辑:
- 有资源 → 展示给用户,流程结束
- 没资源 → 继续第二步
### 第二步:查询并配置机型
操作:调用 add_device_model 检查机型
判断逻辑:
- 机型存在 → 继续第三步
- 机型不存在 → 询问用户营销名,添加后继续
### 第三步:查询出货信息
操作:调用 get_shipment_info
判断逻辑:
- 存在 → 记录信息,不重复配置
- 不存在 → 询问用户是否配置
Skill 的核心价值:把"如果…那么…"的决策逻辑明确写出来,AI 就能按照专家的思路一步步排查。
三、效果对比
3.1 使用前 vs 使用后
| 维度 | 传统方式 | AgentSkill + MCP |
|---|---|---|
| 操作步骤 | 5-6 次手动接口调用 | 1 句话描述问题 |
| 耗时 | 10-30 分钟 | 1-2 分钟 |
| 技能要求 | 必须熟悉业务和接口 | 只需会用 Cursor |
| 结果输出 | 自己整理、容易遗漏 | 标准化表格 + 建议 |
| 可复制性 | 难以传承 | 安装 Skill 即可 |
3.2 实际交互示例
SKILL 内容:
排查案例
四、核心优势
4.1 重复性问题,一键解决
以前同样的问题来 10 次,你要手动排查 10 次。
现在同样的问题来 10 次,你只需要说 10 句话:
"帮我排查机子 XXXX"
AI 会按照 Skill 定义的流程,自动完成所有步骤。
4.2 跨团队协作,零门槛上手
场景:测试团队的同学发现卖场资源加载异常,但不知道如何排查。
传统方式:
- 找开发问
- 开发忙,等排期
- 等到人,远程指导
- 依赖"专家",形成瓶颈
AgentSkill 方式:
- 安装 Agent Skill
- 对 AI 说:“帮我排查机子 xxx”
- 自己就能搞定 ✅
┌─────────────────────────────────────────────────────────┐
│ 知识传递对比 │
├─────────────────────────────────────────────────────────┤
│ │
│ 传统方式: │
│ 专家 ──(口口相传)──► 新人 ──(容易遗忘)──► 再问专家 │
│ │
│ AgentSkill 方式: │
│ 专家 ──(写 Skill)──► AI ──(标准执行)──► 所有人 │
│ │
└─────────────────────────────────────────────────────────┘
五、抛砖引玉:更多可能性
5.1 这只是一个开始
本文介绍的「卖场问题排查」只是一个最小可行案例,用来展示 AgentSkill + MCP 的核心理念:
把专家经验标准化 → 封装成 AI 可执行的流程 → 让任何人都能使用
5.2 适合做成 Skill 的场景
| 场景 | 特点 |
|---|---|
| 🔍 问题排查类 | 有固定排查步骤,需要多次接口调用 |
| 📊 数据查询类 | 需要聚合多个数据源,整理输出 |
| ⚙️ 配置管理类 | 涉及多系统配置,有先后依赖 |
| 📝 流程审批类 | 有明确的判断条件和分支逻辑 |
| 🧪 测试数据构造 | 需要调用多个接口准备测试环境 |
5.3 如何创建自己的 Skill
📁 .cursor/skills/your-skill-name/
└── SKILL.md # 定义角色、流程、判断逻辑
SKILL.md 的核心要素:
- 角色描述:AI 扮演什么角色
- 依赖工具:需要哪些 MCP Tools
- 排查流程:Step by Step 的操作步骤
- 判断逻辑:每一步的"如果…那么…"
- 输出格式:标准化的结果展示
5.4 期待你的探索
每个团队都有自己的"重复性问题"和"专家经验":
- 运维团队的告警排查
- 测试团队的环境配置
- 数据团队的数据校验
- …
把这些经验沉淀成 Skill,让 AI 帮你分担重复劳动,把时间留给更有价值的事情。
六、总结
| 组件 | 作用 |
|---|---|
| MCP Server | 封装业务接口,让 AI 能"动手" |
| AgentSkill | 定义排查流程,让 AI 能"思考" |
| 两者结合 | 让 AI 成为"会操作、会判断"的排查专家 |
AgentSkill + MCP 的本质是:用代码固化专家经验,用 AI 放大专家能力。
更多推荐


所有评论(0)