🤖【RAG学习笔记】开卷考试?让AI从“知识库”里找答案!📚

今天学习了与RAG相关的技术,主要做一些初级科普和自我知识梳理,欢迎交流指正~


1. 📍 什么是RAG?

RAG 的全称是:检索(Retrieval)、增强(Augmentation)、生成(Generation)
它更像是一种解决问题的思路或方案,而不是一个具体的框架。


2. ❓ RAG 是干嘛的?举个栗子🌰

假设我们向大模型提问以下几个问题(先不考虑 MCP 之类复杂设定,只考虑本地知识):

  • 提问1:我现在在深圳图书馆,这个图书馆的AI类的新书,都在第几层?
  • 提问2:牛牛牛公司推出了一款电动车,这款电动车的充电功率是多少瓦?
  • 提问3:在金庸小说中,江南七怪分别是谁?

这些问题都属于特定领域内的知识,大模型在训练时很可能没“见过”这些信息。尤其是像公司新产品、内部文档等垂直性较强的内容。


3. 🧠 解决方法:RAG 就是“开卷考试”!

直接问模型,它可能答不上来。
但如果我们给它“开卷”——也就是提供相关的文档或知识,它就能从中找到答案!

比如:

  • 给你一份深圳图书馆的楼层分布PDF;
  • 给你电动车的产品说明书;
  • 给你整本《射雕英雄传》……

模型就能从中检索出答案啦!而这个存储知识的地方,就是我们常说的 【知识库】


4. 🧩 加上知识库之后,提问变成什么样?

在实际应用中,我们会把问题和知识“包装”在一起扔给模型:

示例A:

已知:【深圳图书馆科技类、AI类新书放在2M层】  
请问:我现在在深圳图书馆,AI类的新书在第几层?

示例B:

已知:【牛牛公司产品手册第5页写明:电动车充电功率为40W】  
请问:牛牛牛公司推出的电动车充电功率是多少瓦?

示例C:

已知:【江南七怪是柯镇恶、朱聪、韩宝驹、南希仁、张阿生、全金发、韩小莹】  
请问:金庸小说中江南七怪分别是谁?

这个 “已知” 部分,其实就是从知识库中检索出来的内容,也就是我们常说的 提示词工程(Prompt Engineering)


5. ⚙️ RAG 的两个阶段

🔹 准备阶段(知识库构建)

  • 将文档、PDF、Excel等数据通过 Embedding 模型转换成向量;
  • 存储到向量数据库中。

🔹 应用阶段(查询与回答)

  • 将用户问题也转换成向量;
  • 在向量数据库中进行相似度计算,找到最匹配的知识片段;
  • 将知识注入提示词中,交给大模型生成答案。

6. 🔍 它是怎么“找”到知识的?

关键在于 Embedding 模型向量相似度计算

  • 问题 → 转换成向量 → 去向量数据库中“比对”;
  • 找到语义最接近的片段(比如“江南七怪”不会匹配到“小龙女”);
  • 提取出来,拼接到提示词中,完成一次 RAG 调用。

7. ✅ RAG 的优势

  • 不需要重新训练模型,低成本实现知识更新;
  • 灵活可控,知识库可随时增删改;
  • 可解释性强,答案来源清晰(来自哪个文档、哪一页)。

8. 💡 我突然悟了:这不就是产品经理的工作吗?!

业务提需求 → 产品经理拆解 → 写出PRD(提示词工程)→ 开发落地(模型生成答案)
简直一模一样啊!!👏


如果大家也在学 RAG,欢迎交流哇~
下次我再写写怎么搭建一个最简单的 RAG 系统!🚀

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐