三分钟搞懂 AI 新词:LLM、Agent、RAG、Skill 到底是啥?
这些新词不是故弄玄虚,而是为了解决一个实际问题——怎么让 AI 从"能聊天"变成"能干活"。
2026 年了,AI 圈的新词一个接一个。别慌,看完这篇你就明白了。
开篇:为什么突然冒出这么多词?
你有没有这种感觉——打开技术社区,满眼都是没见过的词:
“我们用 Agent 架构,结合 RAG 和 Skill,基于 LLM 打造了智能工作流…”
看完一脸懵:每个字都认识,连起来不知道在说啥。
其实,这些词就为了解决一个问题:
怎么让 AI 从"陪聊"变成"干活"?
下面一个个说,保证你听得懂。
一、LLM:AI 的"大脑"
它是啥?
LLM = 大语言模型,就是 AI 的"大脑"。
你可以把它理解成一个读过全世界书的超级学霸:
- 你问它问题,它能回答
- 你让它写东西,它能写
- 你让它翻译,它能翻
但它有个问题
这个学霸有个毛病:它活在自己的世界里。
- 不知道今天发生了什么(知识有截止日期)
- 不知道你的公司内部资料(没接触过私有数据)
- 不会操作电脑(不会点鼠标、不会打开软件)
- 有时候还会"一本正经胡说八道"(专业术语叫"幻觉")
所以,光有 LLM,只能聊天,干不了活。
二、Agent:AI 的"手和脚"
它是啥?
Agent = 智能体,就是给 LLM 这个"大脑"配上"手和脚"。
想象一下:
- LLM 是大脑:负责思考、理解、决策
- Agent 是身体:负责执行、操作、干活
它能干什么?
有了 Agent,AI 就可以:
| 能力 | 例子 |
|---|---|
| 📂 操作文件 | 读取、写入、整理文件 |
| 🌐 上网搜索 | 查实时新闻、查资料 |
| 💻 执行代码 | 运行程序、处理数据 |
| 🔌 调用接口 | 连接各种软件和服务 |
它是怎么工作的?
你说:"帮我整理一下桌面上的所有 PDF 文件,按日期分类"
Agent 的思考过程:
1️⃣ 理解任务:要整理 PDF 文件
2️⃣ 规划步骤:
- 先看看桌面上有哪些 PDF
- 读取每个文件的创建日期
- 按月份创建文件夹
- 把文件挪到对应文件夹里
3️⃣ 执行操作:一步步干
4️⃣ 告诉你结果:"整理完成,共 15 个文件,分成 3 个文件夹"
简单说:Agent 就是让 AI 能真正动手干活的"执行者"。
三、RAG:AI 的"外部知识库"
它是啥?
RAG = 检索增强生成,听起来很复杂,其实很简单。
想象这个场景:
你问 AI:“我们公司去年的营收是多少?”
LLM 一脸懵:“我没看过你们公司的内部数据啊…”
这时候,RAG 就派上用场了。
RAG 是怎么工作的?
1️⃣ 你问:"公司去年营收多少?"
2️⃣ RAG 先去公司数据库/文档里找相关信息
→ 找到《2025 年度财务报告》第 3 页
3️⃣ 把找到的内容 + 你的问题,一起交给 LLM
4️⃣ LLM 基于真实数据回答:
→ "根据 2025 年度财务报告,公司去年营收为 1.2 亿元"
为什么需要 RAG?
| 没有 RAG | 有 RAG |
|---|---|
| ❌ 只能回答公开知识 | ✅ 能回答私有数据 |
| ❌ 容易胡说八道 | ✅ 有依据,可追溯 |
| ❌ 知识会过时 | ✅ 随时更新最新信息 |
简单说:RAG 就是让 AI 能"查资料再回答",避免瞎编。
四、Skill:AI 的"专业技能包"
它是啥?
Skill = 技能,就是把一类能力打包好,让 AI 随时调用。
就像手机 App:
- 想导航?打开地图 App
- 想修图?打开美图 App
- 想写代码?调用"编程 Skill"
常见的 Skill 有哪些?
| Skill | 能干啥 |
|---|---|
| 📝 写作 Skill | 写文章、写邮件、写报告 |
| 💻 编程 Skill | 写代码、改 Bug、解释代码 |
| 📊 数据分析 Skill | 处理表格、画图表、做分析 |
| 🌍 翻译 Skill | 多语言互译 |
| 🔍 搜索 Skill | 联网查资料、找信息 |
为什么需要 Skill?
好处就三个:
- 复用:写好一次,到处能用
- 专业:每个 Skill 专注一件事,做得更好
- 简单:用户不用懂技术,说"帮我写代码"就行
简单说:Skill 就是让 AI 变成"多面手",啥都会一点。
五、Function Calling:AI 的"对讲机"
它是啥?
Function Calling = 函数调用,就是 AI 和程序之间的一种"沟通方式"。
为什么需要它?
想象这个对话:
你:“帮我查一下北京明天的天气”
AI(内心):“我需要调用天气查询工具,参数是城市=北京,日期=明天”
但 AI 不能只说自然语言,程序听不懂。
Function Calling 就是让 AI 用程序能懂的方式说:
{
"function": "get_weather",
"arguments": {
"city": "北京",
"date": "2026-03-03"
}
}
程序一看:“哦,要调天气接口”,然后执行。
简单说:Function Calling 就是让 AI 能"说程序听得懂的话",从而调用各种工具。
六、Workflow:AI 的"工作流程图"
它是啥?
Workflow = 工作流,就是把一件事的步骤固定下来,形成流程。
举个例子
你想把一篇英文论文翻译成中文,还要整理成 Markdown 格式。
手动做要很多步:
- 下载 PDF
- 提取文字
- 翻译
- 校对
- 转成 Markdown
- 保存
用 Workflow,一步搞定:
┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐
│ 读取 PDF │───▶│ 提取文字 │───▶│ 翻译 │───▶│ 转 Markdown │
└─────────┘ └─────────┘ └─────────┘ └─────────┘
│
▼
┌─────────┐
│ 保存文件 │
└─────────┘
为什么需要 Workflow?
- ✅ 省事:复杂任务一键完成
- ✅ 稳定:每次都按同样步骤执行,不会出错
- ✅ 可分享:做好的流程可以给别人用
简单说:Workflow 就是把 AI 干活的步骤"固化"下来,形成自动化流程。
七、MCP:AI 工具的"USB 接口"
它是啥?
MCP = 模型上下文协议,名字很绕,其实很好懂。
打个比方
以前的工具接入,就像老式电脑接外设:
- 打印机有打印机的接口
- 鼠标有鼠标的接口
- 每个设备接口都不一样,麻烦死了
后来有了 USB:
- 不管什么设备,插 USB 就能用
- 统一标准,即插即用
MCP 就是 AI 时代的"USB 标准":
- 不管什么工具,按 MCP 标准接入
- AI 就能识别和使用
- 开发者也不用重复造轮子
简单说:MCP 就是让各种工具能"即插即用"的统一标准。
八、把这些串起来:一个完整例子
假设你要做一个**“智能客服机器人”**,怎么把这些概念都用上?
┌─────────────────────────────────────────────────────────┐
│ 用户问问题 │
│ "你们公司的退货政策是什么?" │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ Agent 接收任务 │
│ - 理解用户意图:询问退货政策 │
│ - 决定:需要查公司内部文档 │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ RAG 检索知识库 │
│ - 在《客服手册》里找到退货政策相关内容 │
│ - 把内容交给 LLM │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ LLM 生成回答 │
│ "根据我司退货政策,商品在 7 天内可无理由退货..." │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ 如果需要进一步操作 │
│ - 用户:"那我要退货" │
│ - Agent 调用 "退货流程 Skill" │
│ - 通过 Function Calling 提交退货申请 │
│ - 按 Workflow 自动处理后续步骤 │
└─────────────────────────────────────────────────────────┘
看到了吗?这些概念不是孤立的,它们配合起来,才能让 AI 真正干活。
九、一张图看懂全部
┌─────────────┐
│ 用户 │
└──────┬──────┘
│
▼
┌─────────────┐
│ Agent │ ← 智能体,负责理解和调度
│ (大管家) │
└──────┬──────┘
│
┌───────────────┼───────────────┐
│ │ │
▼ ▼ ▼
┌────────────┐ ┌────────────┐ ┌────────────┐
│ RAG │ │ Skill │ │ Workflow │
│ (知识库) │ │ (技能包) │ │ (工作流程) │
└─────┬──────┘ └─────┬──────┘ └─────┬──────┘
│ │ │
└──────────────┼──────────────┘
│
▼
┌─────────────┐
│ LLM │ ← 大脑,负责理解和生成
│ (智能核心) │
└─────────────┘
│
▼
┌─────────────┐
│ Function │ ← 沟通方式
│ Calling │
└─────────────┘
│
▼
┌─────────────┐
│ MCP │ ← 工具接入标准
│ (USB 接口) │
└─────────────┘
│
▼
┌─────────────┐
│ 各种工具 │ ← 文件、API、数据库...
└─────────────┘
十、常见问题解答
Q1:这些概念我需要全部学会吗?
不用。
- 如果你只是用 AI,知道 LLM 和 Agent 就够了
- 如果你想开发 AI 应用,再深入了解其他的
Q2:这些技术难不难学?
入门简单,精通需要时间。
- 用现成的工具(如各种 AI 助手)→ 几乎零门槛
- 自己开发 AI 应用 → 需要学编程和相关框架
Q3:现在学这些晚不晚?
不晚,而且正当时。
AI 应用还在早期阶段,现在入局正好。就像 2010 年学手机 App 开发一样,机会很多。
Q4:这些概念会很快过时吗?
核心思想不会过时,具体工具会更新。
- LLM、Agent、RAG 这些核心概念会长期存在
- 具体的框架、库、工具会不断更新换代
学好原理,工具随便换。
最后:记住这三句话
- LLM 是大脑,负责思考和生成
- Agent 是身体,负责执行和干活
- 其他所有概念,都是为了让它们配合得更好
一句话总结:
这些新词不是故弄玄虚,而是为了解决一个实际问题——怎么让 AI 从"能聊天"变成"能干活"。
理解了这一点,你就理解了 90%。
觉得有用?收藏一下,下次别人吹牛时你能听懂了 😉
更多推荐


所有评论(0)