005-RAG-vs-Agent

RAG 让 AI"查资料再回答"，适合知识问答；Agent 让 AI"想清楚、动手干"，

牧子川

116人浏览 · 2026-05-08 21:06:36

牧子川 · 2026-05-08 21:06:36 发布

RAG vs Agent：AI 应用的两种核心范式

💡 摘要：RAG 让 AI"查资料再回答"，适合知识问答；Agent 让 AI"想清楚、动手干"，适合复杂任务。理解两者的区别，才能选对技术方案。

引言

在 AI 应用开发中，你可能经常听到两个词：RAG 和 Agent。

很多人以为它们是一回事，其实它们是完全不同的两种思路：

RAG：像一个懂搜索的学霸，遇到问题先查资料，然后给出准确答案
Agent：像一个能干的助手，不仅会查资料，还能帮你订机票、发邮件、做分析

选择错误的方案，可能导致：

用 RAG 做复杂任务 → 只能回答，无法执行操作
用 Agent 做简单问答 → 过度设计，成本高且不稳定

理解两者的本质区别，是构建 AI 应用的第一步。

核心概念

什么是 RAG？

RAG（Retrieval-Augmented Generation，检索增强生成）的工作流程很简单：

用户提问 → 检索相关知识 → 结合知识生成回答

想象你去图书馆查资料写论文：

先在书架上找到相关书籍（检索）
阅读相关内容（理解）
结合自己的知识写出答案（生成）

特点：

只调用检索器（向量数据库或搜索引擎）
不涉及"下一步做什么"的判断
通常是单轮操作：检索 → 生成 → 结束

什么是 Agent？

Agent（智能体）的工作流程更复杂：

理解目标 → 拆解任务 → 选择工具 → 执行行动 → 观察结果 → 迭代继续

想象你请了一个全能管家：

理解你的需求（感知）
制定行动计划（规划）
调用各种工具完成（行动）
根据结果调整策略（迭代）

特点：

可调用多种工具（搜索、计算器、API、文件系统等）
能自主决策下一步操作
维护内部状态，支持多轮交互

核心对比

一张图看懂区别

维度	RAG	Agent
工作模式	检索 + 生成	感知 - 规划 - 行动
工具调用	只调用检索器	可调用多种工具
决策能力	无决策，按流程走	有决策，动态调整
状态记忆	简单或无状态	维护复杂状态
开发复杂度	低（向量库 + LLM）	高（工具定义 + 状态管理）

类比理解

方案	类比角色	适合场景
RAG	图书管理员	找资料、回答问题
Agent	私人助理	订机票、做分析、自动化流程

适用场景

RAG 适合什么？

核心价值：让 AI 利用私有或实时数据，缓解幻觉，回答依赖外部知识的问题。

场景	示例
企业知识库问答	“公司年假政策是什么？”
客服机器人	查询产品手册、常见问题
学术文献辅助	检索论文并生成摘要
法律/医疗咨询	基于法规或医学指南的问答

限制：RAG 无法主动执行多步操作（比如"发一封邮件，然后根据回复再决定下一步"）。

Agent 适合什么？

核心价值：自主完成复杂、多步骤、需要外部交互的任务。

场景	示例
个人助理	“查航班，价格低于 1000 就预订”
数据分析	“连接数据库，分析销售数据，生成图表并发送邮件”
自动化工作流	处理工单：读取 → 分类 → 检索 → 回复 → 创建任务
游戏 AI	根据环境观察规划行动

限制：Agent 设计复杂，需要提示工程、工具定义、错误处理、记忆管理等，开发成本更高。

代码示例

RAG 极简示例

from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_community.vectorstores import FAISS
from langchain.chains import RetrievalQA

# 1. 创建向量数据库（存储知识）
embeddings = OpenAIEmbeddings()
vectorstore = FAISS.from_texts(
    ["公司年假政策：员工每年有 10 天带薪年假。"],
    embeddings
)

# 2. 创建 RAG 链
llm = ChatOpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=vectorstore.as_retriever()
)

# 3. 提问
response = qa_chain.invoke("公司年假有几天？")
print(response["result"])
# 输出：员工每年有 10 天带薪年假。

Agent 极简示例

from langchain_openai import ChatOpenAI
from langchain.agents import initialize_agent, Tool
from langchain.tools import WikipediaQueryRun

# 1. 定义工具
llm = ChatOpenAI(temperature=0)
search_tool = WikipediaQueryRun()
calculator_tool = Tool(name="计算器", func=lambda x: eval(x))

# 2. 初始化 Agent
agent = initialize_agent(
    tools=[search_tool, calculator_tool],
    llm=llm,
    agent_type="zero-shot-react-description"
)

# 3. 执行复杂任务
response = agent.run(
    "查询 Transformer 是什么，然后计算 15% 的增长是多少（基数 200）"
)
print(response)

何时选择 RAG vs Agent？

判断标准	选 RAG	选 Agent
是否需要外部知识	是，且知识可预先索引	可能需要，但只是步骤之一
是否需要多步推理	否（单轮检索+生成）	是（多轮工具调用）
开发资源	有限，快速上线	充足，追求功能完整
对可靠性要求	较高（检索质量保证）	较低（可能出错，需监督）

决策树

你的需求是什么？
├─ 只是回答基于知识的问题？
│  └─ 选 RAG ✅
├─ 需要执行操作（发邮件、调 API）？
│  └─ 选 Agent ✅
└─ 既要查资料，又要执行操作？
   └─ 选 Agent + 内置 RAG ✅

二者结合：Agent 内置 RAG

实际应用中，Agent 经常将 RAG 作为其中一个工具：

场景：用户问"写一份关于气候变化的最新报告"

Agent 的规划：

调用 RAG 工具从新闻数据库检索最新气候数据
调用搜索工具获取政策文件
调用分析工具计算趋势
生成报告并保存

关键认知：RAG 是 Agent 工具箱中的一个可选能力，而 Agent 是更高级的自主执行体。

最佳实践

简单知识问答选 RAG：开发成本低，可靠性高
复杂多步任务选 Agent：需要规划、决策、工具调用
Agent 可内置 RAG：将 RAG 作为知识检索工具
避免过度设计：不要一上来就用 Agent，先评估 RAG 是否足够
先 RAG 后 Agent：从简单的 RAG 开始，逐步增加 Agent 能力

总结

核心要点回顾：

RAG = 检索 + 生成，适合知识密集型问答
Agent = 感知 + 规划 + 行动，适合复杂多步任务
RAG 是 Agent 的可选工具之一
选择方案时，先评估需求复杂度，避免过度设计

理解这两种范式的区别，能帮你选对技术路线，少走弯路。

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

cover

什么，你也想学我用豆包开发小程序！！！

cover

AIGemini 3.1 Pro助力文物保护：高光谱图像分析新突破

cover

全域数学（GM）半自动推广机器人开发执行文档

所有评论(0)

查看更多评论

牧子川

已为社区贡献22条内容