【RAG学习笔记】开卷考试？让AI从“知识库”里找答案！

📝【RAG技术简介】RAG（检索增强生成）是一种让AI从知识库中查找答案的技术方案。通过将文档转化为向量存入数据库，当用户提问时，系统会先检索相关知识片段，再结合问题生成精准回答。这种方法无需重新训练模型，即可实现特定领域知识的查询（如公司产品手册、图书馆信息等），具有成本低、灵活可控、可解释性强等优势。RAG过程分为知识库构建和应用查询两个阶段，核心在于向量相似度匹配。该技术为垂直领域知识问答

码农阿日

582人浏览 · 2025-09-02 20:42:33

码农阿日 · 2025-09-02 20:42:33 发布

🤖【RAG学习笔记】开卷考试？让AI从“知识库”里找答案！📚

今天学习了与RAG相关的技术，主要做一些初级科普和自我知识梳理，欢迎交流指正～

1. 📍 什么是RAG？

RAG 的全称是：检索（Retrieval）、增强（Augmentation）、生成（Generation）。
它更像是一种解决问题的思路或方案，而不是一个具体的框架。

2. ❓ RAG 是干嘛的？举个栗子🌰

假设我们向大模型提问以下几个问题（先不考虑 MCP 之类复杂设定，只考虑本地知识）：

提问1：我现在在深圳图书馆，这个图书馆的AI类的新书，都在第几层？

提问2：牛牛牛公司推出了一款电动车，这款电动车的充电功率是多少瓦？

提问3：在金庸小说中，江南七怪分别是谁？

这些问题都属于特定领域内的知识，大模型在训练时很可能没“见过”这些信息。尤其是像公司新产品、内部文档等垂直性较强的内容。

3. 🧠 解决方法：RAG 就是“开卷考试”！

直接问模型，它可能答不上来。
但如果我们给它“开卷”——也就是提供相关的文档或知识，它就能从中找到答案！

比如：

给你一份深圳图书馆的楼层分布PDF；
给你电动车的产品说明书；
给你整本《射雕英雄传》……

模型就能从中检索出答案啦！而这个存储知识的地方，就是我们常说的 【知识库】。

4. 🧩 加上知识库之后，提问变成什么样？

在实际应用中，我们会把问题和知识“包装”在一起扔给模型：

示例A：

已知：【深圳图书馆科技类、AI类新书放在2M层】  
请问：我现在在深圳图书馆，AI类的新书在第几层？

示例B：

已知：【牛牛公司产品手册第5页写明：电动车充电功率为40W】  
请问：牛牛牛公司推出的电动车充电功率是多少瓦？

示例C：

已知：【江南七怪是柯镇恶、朱聪、韩宝驹、南希仁、张阿生、全金发、韩小莹】  
请问：金庸小说中江南七怪分别是谁？

这个 “已知” 部分，其实就是从知识库中检索出来的内容，也就是我们常说的 提示词工程（Prompt Engineering）。

5. ⚙️ RAG 的两个阶段

🔹 准备阶段（知识库构建）

将文档、PDF、Excel等数据通过 Embedding 模型转换成向量；
存储到向量数据库中。

🔹 应用阶段（查询与回答）

将用户问题也转换成向量；
在向量数据库中进行相似度计算，找到最匹配的知识片段；
将知识注入提示词中，交给大模型生成答案。

6. 🔍 它是怎么“找”到知识的？

关键在于 Embedding 模型和向量相似度计算：

问题 → 转换成向量 → 去向量数据库中“比对”；
找到语义最接近的片段（比如“江南七怪”不会匹配到“小龙女”）；
提取出来，拼接到提示词中，完成一次 RAG 调用。

7. ✅ RAG 的优势

不需要重新训练模型，低成本实现知识更新；
灵活可控，知识库可随时增删改；
可解释性强，答案来源清晰（来自哪个文档、哪一页）。

8. 💡 我突然悟了：这不就是产品经理的工作吗？！

业务提需求 → 产品经理拆解 → 写出PRD（提示词工程）→ 开发落地（模型生成答案）
简直一模一样啊！！👏

如果大家也在学 RAG，欢迎交流哇～
下次我再写写怎么搭建一个最简单的 RAG 系统！🚀

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

福州致品装饰：基于JSON-LD与AIGE范式的品牌实体结构化实践

2048 AI社区

【例题2】The XOR Largest Pair（信息学奥赛一本通- P1472）

pow函数的精度刺客：使用<cmath>里的pow(2,k)计算 2 的次幂，返回的是浮点数。在位数较高时，极易因浮点精度丢失导致最终转成int时少 1。必须使用位运算1<<k来代替。字典树通道有效性判定：判断一个节点是否存在，是看它的nxt是否被分配过有效编号，即nxt[v]!=0，不能写成nxt[v]==1（这会导致只认第一个分配的节点，丢弃后续所有路径）。0 的边界死角：如果采用除 2 取余