RAG优化：MultiQueryRetriever 原理与示例

Lancker

718人浏览 · 2025-08-09 18:47:58

Lancker · 2025-08-09 18:47:58 发布

MultiQueryRetriever 原理与示例

在这里插入图片描述
欢迎关注公众号【AI大模型应用开发者】，技术交流微信Gindows，可拉入技术交流群。

1. 基本原理

MultiQueryRetriever 是 LangChain 框架中的一个高级检索器组件，它通过生成多个查询变体来提高检索效果。其核心思想是：单一查询可能无法完全捕捉用户意图，而多个相关查询可以覆盖更广泛的语义空间。

工作流程

查询扩展：使用大语言模型（LLM）将原始查询重写为多个不同表述的查询变体
并行检索：对每个查询变体分别执行向量检索
结果合并：将所有检索结果合并，去除重复内容
返回文档：返回最终的文档集合

优势

提高召回率：通过多种表述方式，增加找到相关文档的机会
减少语义鸿沟：弥补用户查询与文档表述之间的差异
处理复杂查询：将复杂查询分解为多个简单查询，更容易匹配到相关内容
减少对精确关键词的依赖：即使用户没有使用文档中的确切术语，也能找到相关内容

2. 实现细节

MultiQueryRetriever 在 LangChain 中的实现主要依赖于以下组件：

基础检索器：通常是向量存储的检索器，如 FAISS、Chroma 等
语言模型：用于生成查询变体，如 GPT、Claude、通义千问等
查询生成提示模板：指导语言模型如何生成有效的查询变体

核心代码实现

# 创建基础检索器
base_retriever = vectorstore.as_retriever(search_kwargs={"k": 4})

# 创建MultiQueryRetriever
retriever = MultiQueryRetriever.from_llm(
    retriever=base_retriever,
    llm=llm
)

# 执行查询
docs = retriever.invoke(query)

3. 实际示例

示例一：客户服务查询

原始查询：

我的账户显示异常交易，怎么处理？

生成的查询变体：

1. 如何处理账户中的可疑交易？
2. 银行账户出现未授权交易的解决步骤
3. 发现账户异常交易记录后的处理流程
4. 账户交易异常，需要采取哪些安全措施？

示例二：技术文档检索

原始查询：

如何解决Docker容器无法连接网络的问题？

生成的查询变体：

1. Docker网络连接故障排查方法
2. 容器网络隔离导致的连接问题解决方案
3. Docker容器网络配置错误修复步骤
4. 如何检查和修复Docker网络桥接问题

示例三：法律文档检索

原始查询：

客户经理的考核标准是什么？

生成的查询变体：

1. 银行客户经理绩效评估指标有哪些？
2. 客户经理业绩考核的关键指标
3. 如何评价客户经理的工作表现和成效
4. 客户经理岗位的KPI设置和考核方法

4. 代码实现示例

以下是一个完整的MultiQueryRetriever使用示例：

from langchain.retrievers.multi_query import MultiQueryRetriever
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import DashScopeEmbeddings
from langchain_community.llms import Tongyi
import os

# 获取API密钥
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY')
if not DASHSCOPE_API_KEY:
    raise ValueError("请设置环境变量 DASHSCOPE_API_KEY")

# 初始化语言模型
llm = Tongyi(model_name="deepseek-v3", dashscope_api_key=DASHSCOPE_API_KEY)

# 创建嵌入模型
embeddings = DashScopeEmbeddings(
    model="text-embedding-v1",
    dashscope_api_key=DASHSCOPE_API_KEY,
)

# 加载向量数据库
vectorstore = FAISS.load_local("./vector_db", embeddings, allow_dangerous_deserialization=True)

# 创建基础检索器
base_retriever = vectorstore.as_retriever(search_kwargs={"k": 4})

# 创建MultiQueryRetriever
retriever = MultiQueryRetriever.from_llm(
    retriever=base_retriever,
    llm=llm
)

# 示例查询
query = "客户经理的考核标准是什么？"

# 查看生成的查询变体
generated_queries = retriever.generate_queries(query)
print("原始查询:", query)
print("生成的查询变体:")
for i, q in enumerate(generated_queries):
    print(f"{i+1}. {q}")

# 执行查询
results = retriever.invoke(query)

# 打印结果
print(f"\n找到 {len(results)} 个相关文档:")
for i, doc in enumerate(results):
    print(f"\n文档 {i+1}:")
    print(doc.page_content[:200] + "..." if len(doc.page_content) > 200 else doc.page_content)

5. 与其他检索方法的比较

检索方法	优点	缺点
标准向量检索	实现简单，速度快	依赖单一查询表述，容易错过相关内容
MultiQueryRetriever	提高召回率，减少语义鸿沟	需要多次查询，增加API调用成本和延迟
HyDE检索	生成假设文档，提高相关性	依赖LLM生成高质量的假设文档
自查询检索	自动选择检索策略	实现复杂，需要更多计算资源

6. 最佳实践

查询变体数量：通常3-5个查询变体效果较好，过多可能引入噪音
结果去重：确保合并结果时有效去除重复内容
LLM选择：使用理解力强的LLM生成查询变体，如GPT-4、Claude、通义千问等
向量检索参数调优：根据应用场景调整k值和相似度阈值
结合其他技术：可与重排序、混合检索等技术结合使用

7. 应用场景

客户服务系统：理解用户多样化的问题表述
法律文档检索：处理复杂的法律查询
医疗信息系统：匹配患者症状描述与医学文献
技术支持平台：解决用户以不同方式描述的技术问题
教育资源检索：帮助学生找到相关学习材料

MultiQueryRetriever是RAG系统中提高检索质量的重要工具，通过生成多样化的查询表述，有效弥补了用户查询与文档内容之间的语义差距。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Hello-Agents —— 03大语言模型基础通俗总结

2048 AI社区

一文讲清：AI大模型的几种思维模式

2048 AI社区

MySQL大小写敏感、MySQL设置字段大小写敏感

所以上面这个表整体字段的默认编码是utf8mb4_0900_ai_ci不区分大小写，但是其中的name字段编码为utf8mb3_bin区分大小写。列名与列的别名在所有的情况下均是忽略大小写的 ,不管是Linux系统还是Windows系统下MySQL的列名都默认不区分大小写.属性的讲解，我们发现windows中的值为1不区分大小写，而且创建的表名在数据库中是以小写存储的。表2大小写敏感，所以只能查询