本文简要介绍AI开发工具中常见名词 agent、skill 和 tool 的概念,以及他们与MCP的关系。由于不同场景下名词含义可能略有区别,这里不做精确描述,读完对它们功能有个大概印象即可。

1. 三者功能介绍

1.1 Agent(智能体)

  • 目的:自主决策和执行的AI实体
  • 特点
    • 具有感知、思考、决策、行动的能力
    • 能够理解用户意图并制定计划
    • 可自主选择使用哪些Skill和Tool
    • 具备上下文理解和动态调整能力
    • 强调自主性和智能性

例子

智能客服Agent:
理解用户问题 → 分析需求 → 决策方案 → 调用相关Skill 

AI助手Agent:
处理复杂任务 → 分解子任务 → 协调多个Skill执行

1.2 Skill(技能)

  • 目的:完成特定业务目标的能力组合
  • 特点
    • 由多个Tool有序组合而成
    • 包含特定场景的业务逻辑
    • 可被Agent选择性调用
    • 强调目标导向

例子

退货处理Skill:
验证 → 查询 → 评估 → 退款 → 通知 订票Skill:搜索 → 比对 → 支付 → 确认

1.3 Tool(工具)

  • 目的:提供原子性的底层操作能力
  • 特点
    • 单一、独立的功能单元
    • 可直接调用外部服务或执行操作
    • 不包含业务逻辑
    • 强调功能执行

例子

HTTP请求Tool:发送API请求 
数据库Tool:数据增删改查 
支付Tool:调用支付接口 
邮件Tool:发送邮件

2. 三者关系

2.1 三者对比

维度 Agent Skill Tool
层级 最高层(大脑) 中间层(能力) 最底层(执行器)
粒度 粗粒度(全局) 中粒度(模块) 细粒度(原子)
复杂度 最复杂 中等 最简单
自主性 有自主决策 无自主决策 无自主决策
构成 由Skill组成 由Tool组成 不可再分
可复用 特定场景 多个Agent共用 通用性最强
示例 ChatGPT、AI助手 退货处理、订票 API、数据库、邮件

2.2 协作流程

Agent、Skill、Tool扮演的角色如下:

Agent      ➜ "我应该做什么?"(决策者)
            • 感知环境
            • 制定计划
            • 做出选择
            • 自我反思

Skill      ➜ "怎样分步骤完成目标?"(流程编排者)
            • 定义业务流程
            • 组织Tool调用顺序
            • 包含业务规则
            • 返回结果

Tool       ➜ "执行具体操作"(执行者)
            • 单一功能
            • 输入→输出
            • 不包含决策
            • 可复用性强

信息流如下:

用户 → Agent → Skill → Tool → 外部系统/数据库
                ↑_______↓
              反馈与调整

控制流如下:

Agent (控制者) 
  ├─ 选择哪个Skill ← 基于用户意图和当前状态
  │
Skill (执行者)
  ├─ 决定Tool调用顺序 ← 基于业务流程
  │
Tool (操作者)
  └─ 执行具体操作 ← 严格按照指令

2.3 实际案例

案例场景:智能酒店预订系统

【Agent】酒店预订Assistant
- 理解用户需求:"我要在北京预订一家5星酒店,住3晚"
- 制定计划:搜索 → 推荐 → 预订 → 支付 → 确认
- 选择Skill:调用"酒店预订Skill"
- 处理异常:如果预订失败,尝试推荐替代方案
- 提供信息:向用户汇报进度和结果

           ▼

【Skill】酒店预订技能
Step1: 调用 搜索酒店Tool
       输入:{城市:"北京", 星级:5, 日期:...}
Step2: 调用 过滤酒店Tool(应用用户偏好)
       输入:{搜索结果, 预算, 设施要求}
Step3: 调用 查询房间Tool
       输入:{酒店ID, 入住日期, 天数}
Step4: 调用 生成报价Tool
       输入:{房间ID, 天数}
Step5: 调用 支付Tool
       输入:{报价, 支付方式}
Step6: 调用 生成订单Tool
Step7: 调用 发送确认Tool(邮件/短信)

           ▼

【Tool】具体操作
- 搜索酒店Tool → 调用酒店数据库API
- 查询房间Tool → 查询库存管理系统
- 支付Tool → 调用第三方支付网关
- 发送确认Tool → 调用邮件/短信服务

2.4 关系总结

三者关系 说明
组成 Agent = Skill集合 + 决策引擎;Skill = Tool集合 + 业务逻辑
调用 Agent主动选择Skill → Skill顺序调用Tool
依赖 Agent依赖Skill;Skill依赖Tool;Tool独立
协作 Agent指挥Skill,Skill指挥Tool
可复用性 Tool最可复用(通用),Skill次之(特定场景),Agent最低(特定领域)

核心印象

  • 🧠 Agent = 大脑(决策、计划、选择)
  • 📋 Skill = 技能(流程、编排、逻辑)
  • 🔧 Tool = 工具(执行、操作、调用)
┌─────────────────────────────────────┐
│        Agent(大脑)                 │
│   "我要完成什么任务?"                 │
│   "应该怎么规划?"                    │
│   "选哪个技能?"                      │
└────────────┬────────────────────────┘
             │
    ┌────────▼─────────┐
    │  Skill(技能)    │
    │ "分几步完成?"     │
    │ "调哪些工具?"     │
    │ "流程是什么?"     │
    └────────┬─────────┘
             │
    ┌────────▼──────────────────┐
    │ Tool1  Tool2  Tool3...    │
    │ "执行操作"                 │
    │ "返回结果"                 │
    └───────────────────────────┘

3. 三者与MCP的协作

3.1 MCP 是什么

3.1.1 MCP简介

MCP = Model Context Protocol(模型上下文协议)

  • 由Anthropic推出的开放标准协议
  • 目的:统一 Agent 与外部资源的交互规范
  • 核心:定义了Client(客户端)和Server(服务器)之间的通信标准; JSON-RPC 风格的请求/响应格式、服务发现、认证机制
  • 解决的问题:AI原本只能依赖训练时学过的知识,无法查实时天气、读本地文件或调用API。过去每次接入新工具都要写定制代码,且存在安全风险(如误操作文件)。MCP用统一规则简化这一过程。
  • 使用流程
    • step1. 工具开发者按MCP封装工具(如天气查询、代码解释器);
    • step2. AI通过协议“发现”并调用这些工具,所有操作需用户明确授权(例如弹窗确认“是否允许读取该文件?”);
    • step3. 返回结果作为“上下文”喂给AI,生成更精准的回答。
  • 好处
    • 对用户:AI能力扩展(查股价、分析文档),同时隐私可控;
    • 对开发者:工具一次开发,多款AI复用,降低集成成本;
    • 生态友好:推动工具共享(类似“AI工具应用商店”)。

3.1.2 MCP核心概念

MCP 包含三个主要元素:

1. Resources(资源)
   ├─ 提供对数据的访问
   └─ 例:文件内容、数据库记录、API数据

2. Tools(工具)
   ├─ 提供可执行的函数
   └─ 例:发送邮件、创建文件、执行计算

3. Prompts(提示)
   ├─ 提供预定义的提示模板
   └─ 例:分析报告的提示、编码风格的提示

3.1.3 MCP 通信流程

MCP使用 JSON-RPC 2.0 协议通信:

┌─────────────┐                    ┌──────────────┐
│ MCP Client  │  ◄─────────────►   │ MCP Server   │
│  (LLM)      │   JSON-RPC 2.0     │ (工具提供者)   │
└─────────────┘                    └──────────────┘

请求示例:调用邮件工具发送邮件

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "send_email",
    "arguments": {
      "to": "user@example.com",
      "subject": "Hello",
      "body": "Test"
    }
  }
}

响应示例:

{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "content": [
      {
        "type": "text",
        "text": "Email sent successfully"
      }
    ]
  }
}

3.2 三者与MCP的协作

MCP 在架构中处于通信层:在Tool层和Skill/Agent层之间,提供标准化的通信方式。

  • 注意⚠️: MCP是一种交互规范,而非功能组件!
┌────────────────────────────────────┐
│               Agent                │ (决策层)
│      (LLM + Decision Engine)       │
└────────────────────────────────────┘
                 │
         ┌───────▼────────┐
         │  Skill Layer   │ (编排层)
         │  (Orchestrate) │
         └───────┬────────┘
                 │
         ┌───────▼──────────────┐
         │   MCP Protocol       │  ◄─── 标准化通信(通信层)
         │  (Communication)     │
         └───────┬──────────────┘
                 │
         ┌───────▼──────────────┐
         │   Tool/Resource      │ (执行层)
         │  (External Systems)  │
         └──────────────────────┘

Agent、Skill、Tool 与MCP的协作流程:


组件/协议 层级 职责 与MCP关系
Agent(组件) 最高 决策、规划 通过MCP调用Skill
Skill(组件) 中间 流程编排 通过MCP编排Tool
Tool(组件) 较低 执行操作 通过MCP暴露能力
MCP(协议) 通信层 标准化协议 连接所有层的桥梁
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐