【RAG学习笔记】开卷考试?让AI从“知识库”里找答案!
📝【RAG技术简介】RAG(检索增强生成)是一种让AI从知识库中查找答案的技术方案。通过将文档转化为向量存入数据库,当用户提问时,系统会先检索相关知识片段,再结合问题生成精准回答。这种方法无需重新训练模型,即可实现特定领域知识的查询(如公司产品手册、图书馆信息等),具有成本低、灵活可控、可解释性强等优势。RAG过程分为知识库构建和应用查询两个阶段,核心在于向量相似度匹配。该技术为垂直领域知识问答
🤖【RAG学习笔记】开卷考试?让AI从“知识库”里找答案!📚
今天学习了与RAG相关的技术,主要做一些初级科普和自我知识梳理,欢迎交流指正~
1. 📍 什么是RAG?
RAG 的全称是:检索(Retrieval)、增强(Augmentation)、生成(Generation)。
它更像是一种解决问题的思路或方案,而不是一个具体的框架。
2. ❓ RAG 是干嘛的?举个栗子🌰
假设我们向大模型提问以下几个问题(先不考虑 MCP 之类复杂设定,只考虑本地知识):
- 提问1:我现在在深圳图书馆,这个图书馆的AI类的新书,都在第几层?
- 提问2:牛牛牛公司推出了一款电动车,这款电动车的充电功率是多少瓦?
- 提问3:在金庸小说中,江南七怪分别是谁?
这些问题都属于特定领域内的知识,大模型在训练时很可能没“见过”这些信息。尤其是像公司新产品、内部文档等垂直性较强的内容。
3. 🧠 解决方法:RAG 就是“开卷考试”!
直接问模型,它可能答不上来。
但如果我们给它“开卷”——也就是提供相关的文档或知识,它就能从中找到答案!
比如:
- 给你一份深圳图书馆的楼层分布PDF;
- 给你电动车的产品说明书;
- 给你整本《射雕英雄传》……
模型就能从中检索出答案啦!而这个存储知识的地方,就是我们常说的 【知识库】。
4. 🧩 加上知识库之后,提问变成什么样?
在实际应用中,我们会把问题和知识“包装”在一起扔给模型:
示例A:
已知:【深圳图书馆科技类、AI类新书放在2M层】
请问:我现在在深圳图书馆,AI类的新书在第几层?
示例B:
已知:【牛牛公司产品手册第5页写明:电动车充电功率为40W】
请问:牛牛牛公司推出的电动车充电功率是多少瓦?
示例C:
已知:【江南七怪是柯镇恶、朱聪、韩宝驹、南希仁、张阿生、全金发、韩小莹】
请问:金庸小说中江南七怪分别是谁?
这个 “已知” 部分,其实就是从知识库中检索出来的内容,也就是我们常说的 提示词工程(Prompt Engineering)。
5. ⚙️ RAG 的两个阶段
🔹 准备阶段(知识库构建)
- 将文档、PDF、Excel等数据通过 Embedding 模型转换成向量;
- 存储到向量数据库中。
🔹 应用阶段(查询与回答)
- 将用户问题也转换成向量;
- 在向量数据库中进行相似度计算,找到最匹配的知识片段;
- 将知识注入提示词中,交给大模型生成答案。
6. 🔍 它是怎么“找”到知识的?
关键在于 Embedding 模型和向量相似度计算:
- 问题 → 转换成向量 → 去向量数据库中“比对”;
- 找到语义最接近的片段(比如“江南七怪”不会匹配到“小龙女”);
- 提取出来,拼接到提示词中,完成一次 RAG 调用。
7. ✅ RAG 的优势
- 不需要重新训练模型,低成本实现知识更新;
- 灵活可控,知识库可随时增删改;
- 可解释性强,答案来源清晰(来自哪个文档、哪一页)。
8. 💡 我突然悟了:这不就是产品经理的工作吗?!
业务提需求 → 产品经理拆解 → 写出PRD(提示词工程)→ 开发落地(模型生成答案)
简直一模一样啊!!👏
如果大家也在学 RAG,欢迎交流哇~
下次我再写写怎么搭建一个最简单的 RAG 系统!🚀
更多推荐



所有评论(0)