AgentSkill + MCP 实现自助问题排查

作者负责维护的卖场项目日常问题比较多,本文以「卖场模式问题排查」为例,介绍如何通过 AgentSkill + MCP 将重复性问题排查工作自动化、标准化,让任何人都能快速上手解决问题。


一、背景:传统排查方式的痛点

1.1 真实场景

想象一下这个场景:你是卖场模式的开发同学,某天你收到这样一条消息:

“这个机子为什么检测不到资源?帮我看一下”

作为"老司机",你需要做以下事情:

📋 传统排查流程:

1️⃣ 打开 Postman / curl,调用资源下发接口,传入机型信息查询资源列表
   → 没有返回数据

2️⃣ 打开另一个接口,查询机型是否存在
   → 机型不存在,需要找用户要营销名

3️⃣ 调用添加机型接口,配置机型信息
   → 配置成功

4️⃣ 调用出货信息查询接口
   → 出货信息不存在

5️⃣ 调用出货信息配置接口
   → 配置成功

6️⃣ 告知用户重试

一个看似简单的问题,实际需要 5-6 次接口调用 + 多次信息确认。

1.2 这种方式的问题

问题 描述
🔁 重复劳动 同样的排查流程,每次都要手动执行一遍
📖 知识壁垒 只有熟悉业务的人才知道完整排查流程
效率低下 每次排查都需要 10-30 分钟
📝 文档陈旧 排查文档经常更新不及时,新人无从下手
🤝 协作困难 其他团队遇到问题只能找"专家",形成瓶颈

更痛苦的是,这些问题每天都在重复发生


二、解决方案:AgentSkill + MCP

2.1 核心思路

我们的目标是:把专家的排查经验"装进" AI,让每个人都能一键排查。

┌─────────────────────────────────────────────────────────────────┐
│                     AgentSkill + MCP 架构                        │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│   用户                                                           │
│     │                                                            │
│     │  "帮我排查机子 XXX 为什么检测不到资源"                           │
│     ▼                                                            │
│   ┌──────────────┐                                               │
│   │  AI Agent    │ ◄─── 加载 SKILL.md(排查专家经验)             │
│   │  (Cursor)    │                                               │
│   └──────┬───────┘                                               │
│          │                                                       │
│          │ 调用 MCP Tools                                        │
│          ▼                                                       │
│   ┌──────────────┐      HTTP      ┌──────────────┐              │
│   │  MCP Server  │ ◄────────────► │  后端接口     │              │
│   │  (Python)    │                │  (业务系统)   │              │
│   └──────────────┘                └──────────────┘              │
│                                                                  │
└─────────────────────────────────────────────────────────────────┘
  • MCP Server:封装业务接口为标准化工具,让 AI 能够调用
  • AgentSkill (SKILL.md):定义排查流程和决策逻辑,赋予 AI “专家思维”

2.2 MCP:让 AI 拥有"操作能力"

MCP (Model Context Protocol) 让 AI 能够调用外部工具。我们把排查所需的接口封装成 MCP Tools:

工具名称 功能
get_rsc_list 根据 IMEI 获取资源下发列表
get_rsc_id 根据资源 ID 获取资源详情
add_device_model 添加/查询机型
get_shipment_info 获取出货信息
set_shipment_info 配置出货信息
search_log_from_nuoa 从日志平台查询日志信息

2.3 AgentSkill:让 AI 拥有"专家思维"

光有工具不够,AI 还需要知道什么时候用什么工具、如何判断结果。这就是 AgentSkill 的作用。

我们将排查专家的经验沉淀成一份 SKILL.md 文件:

## 排查流程 (SOP)

### 第一步:查询资源下发列表
操作:调用 get_rsc_list,传入 IMEI

判断逻辑:
- 有资源 → 展示给用户,流程结束
- 没资源 → 继续第二步

### 第二步:查询并配置机型
操作:调用 add_device_model 检查机型

判断逻辑:
- 机型存在 → 继续第三步
- 机型不存在 → 询问用户营销名,添加后继续

### 第三步:查询出货信息
操作:调用 get_shipment_info

判断逻辑:
- 存在 → 记录信息,不重复配置
- 不存在 → 询问用户是否配置

Skill 的核心价值:把"如果…那么…"的决策逻辑明确写出来,AI 就能按照专家的思路一步步排查。


三、效果对比

3.1 使用前 vs 使用后

维度 传统方式 AgentSkill + MCP
操作步骤 5-6 次手动接口调用 1 句话描述问题
耗时 10-30 分钟 1-2 分钟
技能要求 必须熟悉业务和接口 只需会用 Cursor
结果输出 自己整理、容易遗漏 标准化表格 + 建议
可复制性 难以传承 安装 Skill 即可

3.2 实际交互示例

SKILL 内容:
在这里插入图片描述
排查案例
在这里插入图片描述


四、核心优势

4.1 重复性问题,一键解决

以前同样的问题来 10 次,你要手动排查 10 次。

现在同样的问题来 10 次,你只需要说 10 句话:

"帮我排查机子 XXXX"

AI 会按照 Skill 定义的流程,自动完成所有步骤。

4.2 跨团队协作,零门槛上手

场景:测试团队的同学发现卖场资源加载异常,但不知道如何排查。

传统方式:

  1. 找开发问
  2. 开发忙,等排期
  3. 等到人,远程指导
  4. 依赖"专家",形成瓶颈

AgentSkill 方式:

  1. 安装 Agent Skill
  2. 对 AI 说:“帮我排查机子 xxx”
  3. 自己就能搞定 ✅
┌─────────────────────────────────────────────────────────┐
│                   知识传递对比                           │
├─────────────────────────────────────────────────────────┤
│                                                          │
│   传统方式:                                              │
│   专家 ──(口口相传)──► 新人 ──(容易遗忘)──► 再问专家     │
│                                                          │
│   AgentSkill 方式:                                       │
│   专家 ──(写 Skill)──► AI ──(标准执行)──► 所有人         │
│                                                          │
└─────────────────────────────────────────────────────────┘

五、抛砖引玉:更多可能性

5.1 这只是一个开始

本文介绍的「卖场问题排查」只是一个最小可行案例,用来展示 AgentSkill + MCP 的核心理念:

把专家经验标准化 → 封装成 AI 可执行的流程 → 让任何人都能使用

5.2 适合做成 Skill 的场景

场景 特点
🔍 问题排查类 有固定排查步骤,需要多次接口调用
📊 数据查询类 需要聚合多个数据源,整理输出
⚙️ 配置管理类 涉及多系统配置,有先后依赖
📝 流程审批类 有明确的判断条件和分支逻辑
🧪 测试数据构造 需要调用多个接口准备测试环境

5.3 如何创建自己的 Skill

📁 .cursor/skills/your-skill-name/
└── SKILL.md    # 定义角色、流程、判断逻辑

SKILL.md 的核心要素:

  1. 角色描述:AI 扮演什么角色
  2. 依赖工具:需要哪些 MCP Tools
  3. 排查流程:Step by Step 的操作步骤
  4. 判断逻辑:每一步的"如果…那么…"
  5. 输出格式:标准化的结果展示

5.4 期待你的探索

每个团队都有自己的"重复性问题"和"专家经验":

  • 运维团队的告警排查
  • 测试团队的环境配置
  • 数据团队的数据校验

把这些经验沉淀成 Skill,让 AI 帮你分担重复劳动,把时间留给更有价值的事情。


六、总结

组件 作用
MCP Server 封装业务接口,让 AI 能"动手"
AgentSkill 定义排查流程,让 AI 能"思考"
两者结合 让 AI 成为"会操作、会判断"的排查专家

AgentSkill + MCP 的本质是:用代码固化专家经验,用 AI 放大专家能力。


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐