6 RAG(检索增强生成):企业知识问答的关键
RAG(检索增强生成)是企业知识问答的关键技术,通过检索外部知识库结合大模型生成能力,解决企业内部专有知识问答问题。本文介绍了RAG的核心概念(检索+生成)、应用场景(知识库、智能客服等),并通过Python代码演示了最简版实现——直接向模型"喂"文档内容进行问答。从产品经理视角,文章分析了RAG成为企业AI刚需的原因(知识差异、实时性、合规性)及设计要点(资料收集、更新机制、
·
6 RAG(检索增强生成):企业知识问答的关键
引子
之前我们学习了 API 调用,让大模型可以作为“函数”集成进产品功能。
但是一个问题很快出现:大模型的知识有时间截点,无法回答企业内部的专有问题。比如:
- “我们 2024 年的员工假期制度是什么?”
- “客户 A 的合同条款里提到的赔付上限是多少?”
这些问题,模型本身不知道。解决方案就是今天要学的 RAG(Retrieval-Augmented Generation,检索增强生成)。
一、核心概念
1. 什么是 RAG?
-
通俗解释:RAG 就像给大模型发一份“小抄”。它先去找相关资料,再结合模型的语言能力回答问题。
-
专业定义:RAG = 检索(Retrieval)+ 生成(Generation)。
- 检索:从外部知识库找到与问题最相关的文本片段。
- 生成:把这些片段和用户问题一起输入大模型,生成最终回答。
2. 为什么需要 RAG?
- 解决幻觉:让答案“有出处”。
- 补充知识:模型可以回答企业内部的最新信息。
- 提升可信度:用户能追溯到原始资料,而不是盲目信任模型。
3. RAG 的典型应用
- 企业知识库问答
- 智能客服(结合 FAQ 文档)
- 法律、金融、医疗等对准确性要求极高的场景
👉 一句话总结:RAG 让模型“不仅会说,还会查资料”。
二、实践环节:手动体验“喂资料”
今天先做最轻量的实验 —— 不建数据库,只是直接把文档内容塞进 Prompt。
1. 准备一个文本文件(notes.txt)
例如:
公司 2024 年员工假期制度如下:
1. 年假:每年 10 天。
2. 病假:每年 7 天。
3. 产假:90 天。
2. Python 调用(保存为 rag_demo.py
)
from openai import OpenAI
import os
client = OpenAI(base_url="http://127.0.0.1:11434/v1", api_key="ollama")
with open("notes.txt", "r", encoding="utf-8") as f:
context = f.read()
question = "请问公司 2024 年的年假是多少天?"
prompt = f"""
你是一名企业知识助手。
请仅基于下列上下文回答问题,不能从上下文里找到答案就说“不确定”。
[上下文开始]
{context}
[上下文结束]
问题:{question}
"""
resp = client.chat.completions.create(
model="deepseek-r1",
messages=[{"role": "user", "content": prompt}],
temperature=0.2,
)
print("问题:", question)
print("回答:", resp.choices[0].message.content)
3. 运行
python rag_demo.py
输出示例:
问题: 请问公司 2024 年的年假是多少天?
回答: 根据提供的上下文,公司 2024 年的年假是每年 10 天。
👉 这就是最简版的 RAG —— 直接“喂资料 + 问问题”。
三、产品经理思考
1. 为什么 RAG 是企业 AI 产品的刚需?
- 知识差异:不同公司有不同制度、流程、产品文档 → 不能靠通用大模型。
- 实时性:RAG 可以随时更新资料,而不必重新训练模型。
- 合规性:RAG 可以做到“答案来源于内部资料”,减少法律风险。
2. PM 在设计 RAG 产品时要考虑什么?
- 资料收集:哪些文档要进知识库?格式如何?(PDF、Word、Markdown)
- 数据更新:新制度、新合同如何快速更新到知识库?
- 回答透明度:是否需要展示“引用来源”,增强用户信任。
3. 案例
- 企业知识库助手:员工可以直接问“请给我最新的报销流程”。
- 金融行业客户支持:客服回答必须来自最新的合规手册。
四、小结
今天我们学习了:
- RAG = 检索 + 生成,就像给模型发“小抄”。
- 它解决了模型幻觉、知识缺失和可信度问题。
- 实验:把公司制度文档直接“喂”进模型,回答问题。
- PM 角度:RAG 是企业 AI 产品的核心竞争力,必须考虑资料更新和引用透明度。
更多推荐
所有评论(0)