LLM、Agent、MCP、Skill 是什么?它们之间有什么关系?
本文介绍了AI领域的四个核心概念及其关系:LLM(大语言模型)作为AI大脑,提供语言理解和生成能力;Agent(智能体)为LLM扩展感知、记忆、规划和行动能力;MCP(模型上下文协议)统一AI与外部工具的通信标准;Skill(技能)则是预置的特定任务解决方案。这四个概念构成了完整的AI应用体系:LLM提供基础智能,Agent赋予行动能力,MCP实现工具标准化接入,Skill封装特定领域解决方案。它
LLM、Agent、MCP、Skill 是什么?它们之间有什么关系?
前言
2024-2026 年,AI 领域最火的几个概念莫过于 LLM、Agent、MCP、Skill。这些概念看起来各自独立,实际上它们构成了一个完整的 AI 应用体系。本文将用最通俗的方式,逐一介绍这四个概念,并解释它们之间的关系。
一、LLM(大语言模型)
1.1 是什么?
LLM(Large Language Model,大语言模型)是一种基于深度学习的 AI 模型,通过海量文本数据训练,具备理解和生成自然语言的能力。
简单来说,LLM 就是一个超级大脑——你给它一段文字,它能理解意思并生成回复。
1.2 代表产品
| 模型 | 公司 | 特点 |
|---|---|---|
| GPT-4o | OpenAI | 综合能力最强 |
| Claude | Anthropic | 长文本、编程能力出色 |
| DeepSeek | 深度求索 | 国产开源、性价比高 |
| Gemini | 多模态能力强 | |
| 通义千问 | 阿里 | 国内使用方便 |
1.3 能做什么?
- 文本生成:写文章、写代码、写邮件
- 对话交流:回答问题、闲聊、咨询
- 理解分析:总结文档、分析数据、翻译
- 推理思考:逻辑推理、数学计算、规划
1.4 局限性
LLM 本质上只是一个"语言模型",它有几个关键局限:
- 没有记忆:每次对话都是独立的,不记得上次聊了什么(除非你把历史记录传给它)
- 没有行动能力:只能生成文字,不能操作电脑、发邮件、查数据库
- 知识有截止日期:训练数据有时间界限,不知道最新发生的事
- 可能产生幻觉:有时会一本正经地编造不存在的信息
这些局限,正是 Agent 要解决的问题。
二、Agent(智能体)
2.1 是什么?
Agent(智能体/智能代理)是以 LLM 为"大脑",加上感知、记忆、工具使用、规划能力的 AI 系统。
如果说 LLM 是一个聪明但只会说话的大脑,那 Agent 就是给这个大脑装上了眼睛(感知)、手脚(工具)、记事本(记忆)和计划表(规划)。
2.2 Agent 的核心组成
┌─────────────────────────────────────┐
│ Agent │
│ │
│ ┌──────────┐ ┌──────────┐ │
│ │ LLM │ │ Memory │ │
│ │ (大脑) │ │ (记忆) │ │
│ └────┬─────┘ └──────────┘ │
│ │ │
│ ┌────▼─────┐ ┌──────────┐ │
│ │ Planning │ │ Tools │ │
│ │ (规划) │ │ (工具) │ │
│ └──────────┘ └──────────┘ │
└─────────────────────────────────────┘
四大能力:
- 感知(Perception):理解用户输入、读取文件、获取网页内容
- 记忆(Memory):短期记忆(当前对话上下文)和长期记忆(数据库存储)
- 规划(Planning):将复杂任务分解为多个步骤,制定执行计划
- 行动(Action):调用外部工具完成具体任务
2.3 Agent 的工作流程
用户:帮我查看今天的天气,然后发一封邮件给老板,告诉他明天要下雨,建议取消户外活动
Agent 的思考过程:
1. [规划] 这个任务需要两步:查天气 → 发邮件
2. [行动] 调用「天气查询工具」→ 获取明天天气:暴雨
3. [行动] 调用「邮件发送工具」→ 发送邮件给老板
4. [回复] 已查询到明天天气为暴雨,邮件已发送给老板
2.4 代表产品
| 产品 | 类型 | 说明 |
|---|---|---|
| Cursor | 编程 Agent | 自动读代码、写代码、运行命令 |
| Manus | 通用 Agent | 自动操作浏览器、执行复杂任务 |
| AutoGPT | 开源 Agent | 自主规划和执行任务 |
| Devin | 编程 Agent | AI 软件工程师 |
| 扣子(Coze) | Agent 平台 | 可视化搭建 Agent |
2.5 Agent 面临的核心问题
Agent 需要调用各种外部工具(API、数据库、文件系统等),但每个工具的接口格式都不一样。这就像一个人要同时操作几十种不同的遥控器,非常混乱。
这个问题,正是 MCP 要解决的。
三、MCP(模型上下文协议)
3.1 是什么?
MCP(Model Context Protocol,模型上下文协议)是 Anthropic 公司于 2024 年 11 月发布的一个开放标准协议,用于统一 AI 模型与外部数据源、工具之间的通信方式。
简单来说,MCP 就是 AI 世界的 USB 接口——不管什么设备,只要支持 USB 接口,就能即插即用。MCP 也一样,不管什么工具或数据源,只要实现了 MCP 协议,Agent 就能直接使用。
3.2 为什么需要 MCP?
没有 MCP 之前:
Agent ──自定义接口──→ GitHub API
Agent ──另一种接口──→ 数据库
Agent ──又一种接口──→ 文件系统
Agent ──还一种接口──→ 邮件服务
每个工具都需要写专门的对接代码,维护成本极高。
有了 MCP 之后:
Agent ──MCP协议──→ GitHub MCP Server
Agent ──MCP协议──→ 数据库 MCP Server
Agent ──MCP协议──→ 文件系统 MCP Server
Agent ──MCP协议──→ 邮件 MCP Server
所有工具都通过统一的 MCP 协议通信,Agent 只需要学会一种"语言"就能调用所有工具。
3.3 MCP 的架构
┌──────────┐ MCP协议 ┌───────────────┐
│ │ ◄──────────────► │ MCP Server │
│ │ │ (GitHub) │
│ │ MCP协议 ┌───────────────┐
│ MCP │ ◄──────────────► │ MCP Server │
│ Client │ │ (数据库) │
│ (Agent) │ MCP协议 ┌───────────────┐
│ │ ◄──────────────► │ MCP Server │
│ │ │ (文件系统) │
└──────────┘ └───────────────┘
三个核心概念:
- MCP Client(客户端):通常是 Agent 或 AI 应用,负责发起请求
- MCP Server(服务端):封装了具体工具的能力,提供统一接口
- MCP Protocol(协议):定义了客户端和服务端之间的通信格式
3.4 MCP 提供的三种能力
| 能力 | 说明 | 类比 |
|---|---|---|
| Tools(工具) | 可执行的操作,如查询数据库、发送消息 | 遥控器上的按钮 |
| Resources(资源) | 可读取的数据,如文件、API 返回的数据 | 电视频道 |
| Prompts(提示词) | 预定义的 Prompt 模板 | 预设的频道列表 |
3.5 MCP 配置示例
{
"mcpServers": {
"github": {
"command": "npx",
"args": ["@modelcontextprotocol/server-github"],
"env": {
"GITHUB_TOKEN": "your-token"
}
},
"filesystem": {
"command": "npx",
"args": ["@modelcontextprotocol/server-filesystem", "/path/to/files"]
},
"database": {
"command": "npx",
"args": ["@modelcontextprotocol/server-sqlite", "path/to/db.sqlite"]
}
}
}
3.6 常见的 MCP Server
| MCP Server | 功能 |
|---|---|
| GitHub | 操作仓库、Issue、PR |
| FileSystem | 读写本地文件 |
| SQLite/Postgres | 查询数据库 |
| Brave Search | 搜索网页 |
| Slack | 发送消息 |
| Google Maps | 地图查询 |
四、Skill(技能)
4.1 是什么?
Skill(技能)是预定义的、可复用的指令集合,告诉 Agent 在特定场景下应该如何行动。
如果 MCP 是"工具箱",那 Skill 就是"操作手册"。工具箱里有锤子、螺丝刀、扳手,但你还需要一本手册告诉你"装柜子的时候,先用螺丝刀拧底板,再用扳手固定支架"。
4.2 Skill 的结构
一个典型的 Skill 文件(SKILL.md)包含:
# 技能名称
## 触发条件
当用户要求... 时触发
## 执行步骤
1. 第一步:做什么
2. 第二步:做什么
3. 第三步:做什么
## 注意事项
- 注意点 1
- 注意点 2
## 输出格式
- 输出要求
4.3 Skill 的实际例子
例子 1:创建 Vue 组件的 Skill
# 创建 Vue 组件
## 触发条件
当用户要求创建一个新的 Vue 组件时
## 执行步骤
1. 在 src/components/ 目录下创建组件文件
2. 使用 <script setup lang="ts"> 语法
3. 使用 SCSS scoped 样式
4. 添加必要的 Props 类型定义
5. 遵循项目的命名规范(PascalCase)
例子 2:部署项目的 Skill
# Docker 部署
## 触发条件
当用户要求部署项目时
## 执行步骤
1. 检查 Dockerfile 是否存在
2. 检查 docker-compose.yml 配置
3. 执行 docker compose build
4. 执行 docker compose up -d
5. 检查容器运行状态
6. 验证服务是否正常
4.4 Skill 与 Prompt 的区别
| 特性 | Prompt | Skill |
|---|---|---|
| 用途 | 单次对话指令 | 可复用的操作流程 |
| 复杂度 | 简单指令 | 多步骤流程 |
| 持久性 | 一次性使用 | 永久保存,反复调用 |
| 触发方式 | 手动输入 | 自动匹配触发 |
| 范围 | 针对单个任务 | 针对一类任务 |
五、四者之间的关系
5.1 关系图
┌─────────────────────────────────────────────────┐
│ Agent │
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ LLM │ │ Skill │ │ Memory │ │
│ │ (大脑) │ │ (操作手册)│ │ (记忆) │ │
│ └────┬────┘ └────┬────┘ └─────────┘ │
│ │ │ │
│ └──────┬───────┘ │
│ │ │
│ ┌──────▼──────┐ │
│ │ Planning │ │
│ │ (规划执行) │ │
│ └──────┬──────┘ │
│ │ │
│ ┌──────▼──────┐ │
│ │ MCP │ │
│ │ (工具接口) │ │
│ └──────┬──────┘ │
└───────────────┼──────────────────────────────────┘
│
┌───────────┼───────────┐
│ │ │
┌───▼───┐ ┌────▼───┐ ┌────▼───┐
│GitHub │ │数据库 │ │文件系统 │
│Server │ │Server │ │Server │
└───────┘ └────────┘ └────────┘
5.2 类比理解
用一个人类员工来类比:
| 概念 | 类比 | 作用 |
|---|---|---|
| LLM | 大脑 | 理解和思考能力 |
| Agent | 完整的人 | 有大脑、有手脚、能行动 |
| MCP | 工具接口标准 | 统一的工具使用方式 |
| Skill | 操作手册/SOP | 告诉人在特定场景下怎么做 |
5.3 工作流程示例
场景:用户说"帮我在 GitHub 创建一个新项目,初始化 Vue 3 模板"
1. [Agent] 接收用户请求
2. [LLM] 理解意图 → 需要创建 GitHub 仓库 + 初始化 Vue 项目
3. [Skill] 匹配到「创建 Vue 项目」技能
→ 获取标准操作流程
4. [Agent] 根据 Skill 规划执行步骤:
① 在 GitHub 创建仓库
② 克隆到本地
③ 用 Vite 初始化 Vue 3 模板
④ 提交代码推送
5. [MCP] 通过 MCP 协议调用工具:
① GitHub MCP Server → 创建仓库
② FileSystem MCP Server → 操作本地文件
③ Shell MCP Server → 执行 npm 命令
6. [Agent] 汇总结果,回复用户
5.4 层次关系
底层 ←──────────────────────────────→ 高层
LLM → MCP → Skill → Agent
(基础能力) (工具标准) (操作流程) (完整系统)
语言理解 统一工具接口 定义做事方式 整合所有能力
语言生成 连接外部世界 积累经验知识 自主完成任务
六、实际应用场景
6.1 Cursor IDE(编程场景)
Cursor = Agent
├── LLM:Claude/GPT(理解代码、生成代码)
├── MCP:FileSystem Server(读写文件)
│ Shell Server(执行命令)
│ GitHub Server(Git 操作)
├── Skill:创建组件规范、代码风格指南、部署流程
└── Memory:当前项目上下文、之前的对话
6.2 个人博客 AI 功能(本项目)
博客 AI 助手 = 简化版 Agent
├── LLM:DeepSeek API(生成总结、回答问题)
├── Tools:数据库查询(代办、日记数据)
├── Skill:总结报告模板、改进建议维度
└── Memory:AI 记录表(持久化保存)
6.3 企业级 AI 助手
企业 Agent
├── LLM:GPT-4(理解业务需求)
├── MCP:
│ ├── CRM Server(客户关系管理)
│ ├── ERP Server(企业资源规划)
│ ├── Email Server(邮件系统)
│ └── Calendar Server(日程管理)
├── Skill:
│ ├── 客户跟进 SOP
│ ├── 报告生成模板
│ └── 会议安排流程
└── Memory:企业知识库、历史交互记录
七、发展趋势
7.1 LLM 的发展
- 模型能力持续提升:推理、编程、多模态
- 成本持续下降:开源模型(DeepSeek、Llama)让 AI 更普惠
- 专业化方向:医疗、法律、金融等垂直领域模型
7.2 Agent 的发展
- 从单一 Agent 到多 Agent 协作:多个 Agent 分工合作
- 从对话式到自主式:Agent 能自主发现和解决问题
- 从工具调用到环境交互:Agent 能操作浏览器、桌面应用
7.3 MCP 的发展
- 更多官方 MCP Server:覆盖更多常用服务
- 企业级 MCP Server:对接企业内部系统
- MCP 生态成熟:类似 npm 的 MCP Server 市场
7.4 Skill 的发展
- Skill 市场:社区共享和交易 Skill
- 自动 Skill 学习:Agent 从交互中自动总结 Skill
- Skill 组合:多个 Skill 自动编排形成复杂工作流
八、总结
| 概念 | 一句话解释 |
|---|---|
| LLM | AI 的大脑,负责理解和生成语言 |
| Agent | AI 的完整体,有大脑、手脚、记忆,能自主行动 |
| MCP | AI 的万能工具接口,统一连接各种外部服务 |
| Skill | AI 的操作手册,定义特定场景下的标准操作流程 |
它们的关系:LLM 是基础,Agent 是整体框架,MCP 解决工具连接问题,Skill 提供操作知识。四者共同构成了现代 AI 应用的完整技术栈。
理解了这四个概念,你就掌握了当前 AI 应用开发的核心知识体系。无论是使用 Cursor 写代码,还是搭建自己的 AI 应用,这些概念都是基础。
更多推荐


所有评论(0)