LLM、Agent、MCP、Skill 是什么?它们之间有什么关系?

前言

2024-2026 年,AI 领域最火的几个概念莫过于 LLMAgentMCPSkill。这些概念看起来各自独立,实际上它们构成了一个完整的 AI 应用体系。本文将用最通俗的方式,逐一介绍这四个概念,并解释它们之间的关系。

一、LLM(大语言模型)

1.1 是什么?

LLM(Large Language Model,大语言模型)是一种基于深度学习的 AI 模型,通过海量文本数据训练,具备理解和生成自然语言的能力。

简单来说,LLM 就是一个超级大脑——你给它一段文字,它能理解意思并生成回复。

1.2 代表产品

模型 公司 特点
GPT-4o OpenAI 综合能力最强
Claude Anthropic 长文本、编程能力出色
DeepSeek 深度求索 国产开源、性价比高
Gemini Google 多模态能力强
通义千问 阿里 国内使用方便

1.3 能做什么?

  • 文本生成:写文章、写代码、写邮件
  • 对话交流:回答问题、闲聊、咨询
  • 理解分析:总结文档、分析数据、翻译
  • 推理思考:逻辑推理、数学计算、规划

1.4 局限性

LLM 本质上只是一个"语言模型",它有几个关键局限:

  • 没有记忆:每次对话都是独立的,不记得上次聊了什么(除非你把历史记录传给它)
  • 没有行动能力:只能生成文字,不能操作电脑、发邮件、查数据库
  • 知识有截止日期:训练数据有时间界限,不知道最新发生的事
  • 可能产生幻觉:有时会一本正经地编造不存在的信息

这些局限,正是 Agent 要解决的问题。

二、Agent(智能体)

2.1 是什么?

Agent(智能体/智能代理)是以 LLM 为"大脑",加上感知、记忆、工具使用、规划能力的 AI 系统。

如果说 LLM 是一个聪明但只会说话的大脑,那 Agent 就是给这个大脑装上了眼睛(感知)、手脚(工具)、记事本(记忆)和计划表(规划)。

2.2 Agent 的核心组成

┌─────────────────────────────────────┐
│              Agent                   │
│                                      │
│  ┌──────────┐    ┌──────────┐       │
│  │   LLM    │    │  Memory  │       │
│  │  (大脑)   │    │  (记忆)   │       │
│  └────┬─────┘    └──────────┘       │
│       │                              │
│  ┌────▼─────┐    ┌──────────┐       │
│  │ Planning │    │  Tools   │       │
│  │  (规划)   │    │  (工具)   │       │
│  └──────────┘    └──────────┘       │
└─────────────────────────────────────┘

四大能力:

  1. 感知(Perception):理解用户输入、读取文件、获取网页内容
  2. 记忆(Memory):短期记忆(当前对话上下文)和长期记忆(数据库存储)
  3. 规划(Planning):将复杂任务分解为多个步骤,制定执行计划
  4. 行动(Action):调用外部工具完成具体任务

2.3 Agent 的工作流程

用户:帮我查看今天的天气,然后发一封邮件给老板,告诉他明天要下雨,建议取消户外活动

Agent 的思考过程:
1. [规划] 这个任务需要两步:查天气 → 发邮件
2. [行动] 调用「天气查询工具」→ 获取明天天气:暴雨
3. [行动] 调用「邮件发送工具」→ 发送邮件给老板
4. [回复] 已查询到明天天气为暴雨,邮件已发送给老板

2.4 代表产品

产品 类型 说明
Cursor 编程 Agent 自动读代码、写代码、运行命令
Manus 通用 Agent 自动操作浏览器、执行复杂任务
AutoGPT 开源 Agent 自主规划和执行任务
Devin 编程 Agent AI 软件工程师
扣子(Coze) Agent 平台 可视化搭建 Agent

2.5 Agent 面临的核心问题

Agent 需要调用各种外部工具(API、数据库、文件系统等),但每个工具的接口格式都不一样。这就像一个人要同时操作几十种不同的遥控器,非常混乱。

这个问题,正是 MCP 要解决的。

三、MCP(模型上下文协议)

3.1 是什么?

MCP(Model Context Protocol,模型上下文协议)是 Anthropic 公司于 2024 年 11 月发布的一个开放标准协议,用于统一 AI 模型与外部数据源、工具之间的通信方式。

简单来说,MCP 就是 AI 世界的 USB 接口——不管什么设备,只要支持 USB 接口,就能即插即用。MCP 也一样,不管什么工具或数据源,只要实现了 MCP 协议,Agent 就能直接使用。

3.2 为什么需要 MCP?

没有 MCP 之前:

Agent ──自定义接口──→ GitHub API
Agent ──另一种接口──→ 数据库
Agent ──又一种接口──→ 文件系统
Agent ──还一种接口──→ 邮件服务

每个工具都需要写专门的对接代码,维护成本极高。

有了 MCP 之后:

Agent ──MCP协议──→ GitHub MCP Server
Agent ──MCP协议──→ 数据库 MCP Server
Agent ──MCP协议──→ 文件系统 MCP Server
Agent ──MCP协议──→ 邮件 MCP Server

所有工具都通过统一的 MCP 协议通信,Agent 只需要学会一种"语言"就能调用所有工具。

3.3 MCP 的架构

┌──────────┐     MCP协议     ┌───────────────┐
│          │ ◄──────────────► │  MCP Server   │
│          │                  │  (GitHub)     │
│          │     MCP协议     ┌───────────────┐
│  MCP     │ ◄──────────────► │  MCP Server   │
│  Client  │                  │  (数据库)      │
│  (Agent) │     MCP协议     ┌───────────────┐
│          │ ◄──────────────► │  MCP Server   │
│          │                  │  (文件系统)    │
└──────────┘                  └───────────────┘

三个核心概念:

  1. MCP Client(客户端):通常是 Agent 或 AI 应用,负责发起请求
  2. MCP Server(服务端):封装了具体工具的能力,提供统一接口
  3. MCP Protocol(协议):定义了客户端和服务端之间的通信格式

3.4 MCP 提供的三种能力

能力 说明 类比
Tools(工具) 可执行的操作,如查询数据库、发送消息 遥控器上的按钮
Resources(资源) 可读取的数据,如文件、API 返回的数据 电视频道
Prompts(提示词) 预定义的 Prompt 模板 预设的频道列表

3.5 MCP 配置示例

{
  "mcpServers": {
    "github": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-github"],
      "env": {
        "GITHUB_TOKEN": "your-token"
      }
    },
    "filesystem": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-filesystem", "/path/to/files"]
    },
    "database": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-sqlite", "path/to/db.sqlite"]
    }
  }
}

3.6 常见的 MCP Server

MCP Server 功能
GitHub 操作仓库、Issue、PR
FileSystem 读写本地文件
SQLite/Postgres 查询数据库
Brave Search 搜索网页
Slack 发送消息
Google Maps 地图查询

四、Skill(技能)

4.1 是什么?

Skill(技能)是预定义的、可复用的指令集合,告诉 Agent 在特定场景下应该如何行动。

如果 MCP 是"工具箱",那 Skill 就是"操作手册"。工具箱里有锤子、螺丝刀、扳手,但你还需要一本手册告诉你"装柜子的时候,先用螺丝刀拧底板,再用扳手固定支架"。

4.2 Skill 的结构

一个典型的 Skill 文件(SKILL.md)包含:

# 技能名称

## 触发条件
当用户要求... 时触发

## 执行步骤
1. 第一步:做什么
2. 第二步:做什么
3. 第三步:做什么

## 注意事项
- 注意点 1
- 注意点 2

## 输出格式
- 输出要求

4.3 Skill 的实际例子

例子 1:创建 Vue 组件的 Skill

# 创建 Vue 组件

## 触发条件
当用户要求创建一个新的 Vue 组件时

## 执行步骤
1. 在 src/components/ 目录下创建组件文件
2. 使用 <script setup lang="ts"> 语法
3. 使用 SCSS scoped 样式
4. 添加必要的 Props 类型定义
5. 遵循项目的命名规范(PascalCase)

例子 2:部署项目的 Skill

# Docker 部署

## 触发条件
当用户要求部署项目时

## 执行步骤
1. 检查 Dockerfile 是否存在
2. 检查 docker-compose.yml 配置
3. 执行 docker compose build
4. 执行 docker compose up -d
5. 检查容器运行状态
6. 验证服务是否正常

4.4 Skill 与 Prompt 的区别

特性 Prompt Skill
用途 单次对话指令 可复用的操作流程
复杂度 简单指令 多步骤流程
持久性 一次性使用 永久保存,反复调用
触发方式 手动输入 自动匹配触发
范围 针对单个任务 针对一类任务

五、四者之间的关系

5.1 关系图

┌─────────────────────────────────────────────────┐
│                    Agent                         │
│                                                  │
│   ┌─────────┐   ┌─────────┐   ┌─────────┐      │
│   │   LLM   │   │  Skill  │   │  Memory │      │
│   │  (大脑)  │   │ (操作手册)│   │  (记忆)  │      │
│   └────┬────┘   └────┬────┘   └─────────┘      │
│        │              │                          │
│        └──────┬───────┘                          │
│               │                                  │
│        ┌──────▼──────┐                           │
│        │   Planning   │                          │
│        │  (规划执行)   │                          │
│        └──────┬──────┘                           │
│               │                                  │
│        ┌──────▼──────┐                           │
│        │     MCP     │                           │
│        │  (工具接口)  │                           │
│        └──────┬──────┘                           │
└───────────────┼──────────────────────────────────┘
                │
    ┌───────────┼───────────┐
    │           │           │
┌───▼───┐ ┌────▼───┐ ┌────▼───┐
│GitHub │ │数据库   │ │文件系统 │
│Server │ │Server  │ │Server  │
└───────┘ └────────┘ └────────┘

5.2 类比理解

用一个人类员工来类比:

概念 类比 作用
LLM 大脑 理解和思考能力
Agent 完整的人 有大脑、有手脚、能行动
MCP 工具接口标准 统一的工具使用方式
Skill 操作手册/SOP 告诉人在特定场景下怎么做

5.3 工作流程示例

场景:用户说"帮我在 GitHub 创建一个新项目,初始化 Vue 3 模板"

1. [Agent] 接收用户请求
   
2. [LLM] 理解意图 → 需要创建 GitHub 仓库 + 初始化 Vue 项目

3. [Skill] 匹配到「创建 Vue 项目」技能
   → 获取标准操作流程

4. [Agent] 根据 Skill 规划执行步骤:
   ① 在 GitHub 创建仓库
   ② 克隆到本地
   ③ 用 Vite 初始化 Vue 3 模板
   ④ 提交代码推送

5. [MCP] 通过 MCP 协议调用工具:
   ① GitHub MCP Server → 创建仓库
   ② FileSystem MCP Server → 操作本地文件
   ③ Shell MCP Server → 执行 npm 命令

6. [Agent] 汇总结果,回复用户

5.4 层次关系

底层 ←──────────────────────────────→ 高层

LLM        →    MCP       →    Skill      →    Agent
(基础能力)      (工具标准)      (操作流程)       (完整系统)

语言理解     统一工具接口    定义做事方式    整合所有能力
语言生成     连接外部世界    积累经验知识    自主完成任务

六、实际应用场景

6.1 Cursor IDE(编程场景)

Cursor = Agent
├── LLM:Claude/GPT(理解代码、生成代码)
├── MCP:FileSystem Server(读写文件)
│       Shell Server(执行命令)
│       GitHub Server(Git 操作)
├── Skill:创建组件规范、代码风格指南、部署流程
└── Memory:当前项目上下文、之前的对话

6.2 个人博客 AI 功能(本项目)

博客 AI 助手 = 简化版 Agent
├── LLM:DeepSeek API(生成总结、回答问题)
├── Tools:数据库查询(代办、日记数据)
├── Skill:总结报告模板、改进建议维度
└── Memory:AI 记录表(持久化保存)

6.3 企业级 AI 助手

企业 Agent
├── LLM:GPT-4(理解业务需求)
├── MCP:
│   ├── CRM Server(客户关系管理)
│   ├── ERP Server(企业资源规划)
│   ├── Email Server(邮件系统)
│   └── Calendar Server(日程管理)
├── Skill:
│   ├── 客户跟进 SOP
│   ├── 报告生成模板
│   └── 会议安排流程
└── Memory:企业知识库、历史交互记录

七、发展趋势

7.1 LLM 的发展

  • 模型能力持续提升:推理、编程、多模态
  • 成本持续下降:开源模型(DeepSeek、Llama)让 AI 更普惠
  • 专业化方向:医疗、法律、金融等垂直领域模型

7.2 Agent 的发展

  • 从单一 Agent 到多 Agent 协作:多个 Agent 分工合作
  • 从对话式到自主式:Agent 能自主发现和解决问题
  • 从工具调用到环境交互:Agent 能操作浏览器、桌面应用

7.3 MCP 的发展

  • 更多官方 MCP Server:覆盖更多常用服务
  • 企业级 MCP Server:对接企业内部系统
  • MCP 生态成熟:类似 npm 的 MCP Server 市场

7.4 Skill 的发展

  • Skill 市场:社区共享和交易 Skill
  • 自动 Skill 学习:Agent 从交互中自动总结 Skill
  • Skill 组合:多个 Skill 自动编排形成复杂工作流

八、总结

概念 一句话解释
LLM AI 的大脑,负责理解和生成语言
Agent AI 的完整体,有大脑、手脚、记忆,能自主行动
MCP AI 的万能工具接口,统一连接各种外部服务
Skill AI 的操作手册,定义特定场景下的标准操作流程

它们的关系:LLM 是基础,Agent 是整体框架,MCP 解决工具连接问题,Skill 提供操作知识。四者共同构成了现代 AI 应用的完整技术栈。

理解了这四个概念,你就掌握了当前 AI 应用开发的核心知识体系。无论是使用 Cursor 写代码,还是搭建自己的 AI 应用,这些概念都是基础。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐