RAG高级技术

RAG高级技术Q：embedding时，markdown和txt 有何区别?embedding时markdown比txt损失更小如果是PDF PPI建议转成Q：公司做运维场景的智能体用什么框架好?思考运维智能体有哪些功能需搭建哪些toolRAG：从1000万众=>召回（关键词）100个=>重排（重排模型相对较大，计算量较大)推荐系统：1000万=>召回100个=>重排召回可以是多渠道的，可以

xuanwuziyou

484人浏览 · 2025-08-10 11:10:05

xuanwuziyou · 2025-08-10 11:10:05 发布

RAG高级技术

Q：embedding时，markdown和txt 有何区别?
embedding时markdown比txt损失更小如果是PDF PPI建议转成

Q：公司做运维场景的智能体用什么框架好?
langchain langgraph qwen-agent
思考运维智能体有哪些功能需搭建哪些tool

RAG：从1000万众=>召回（关键词）100个=>重排（重排模型相对较
大，计算量较大)

推荐系统：1000万=>召回100个=>重排

召回可以是多渠道的，可以是向量检索或关键词
可以在 modelscope 上搜索 rerank 模型：bge-rerank，cohere-rerank,
rerank模型是把问题和答案直接的相关性进行一个打分

RAG高效召回方法

1 改进检索算法
知识图谱：利用知识图谱中的语义信息和实体关系，增强对查询和文
档的理解，提升召回的相关性

2 引入重排序 reranking
重排序模型：对召回结果进行重排，提升问题和文档的相关性，常见
的重排模型有 bge-rerank 和 cohere-rerank
bge-rerank开源，可本地部署，支持中英文，适用数据敏感、垂直
领域。
cohere-rerank商业API，云端调用，多语言(v3.0)，适用快速集
成，多语言优化。
混合检索：结合向量检索和关键词检索的优势，通过重排序模型对结
果进行归一化处理，提升召回质量

3 优化查询拓展
相似语义改写：使用大模型将用户查询改成成多个语义相近的查询，
提升召回多样性。例如 LangChain 的 MultiQueryRetriever支持
多查询召回。

Query改写

rag的核心是检索和生成。如果第一步检索的质量差，那么后续的生成
质量也会降低。
用户提出的问题往往是口语化的、承接上下文的、模糊的，甚至是包
含了情绪的，所以需要将用户的口语化的查询转换成书面化精确的
检索语句。

如何对不同类型的query进行改写：
通过精心设计的 prompt 来引导 LLM 完成这项任务

Query意图识别：
上下文依赖型
对比型
模糊指代型
多意图型
反问型

先让AI自动分析是哪种类型的query，再进行改写，还可以提供置信
度

rag可以用开源的，比如dify，ragflow，qwen-agent

Query + 联网搜索（识别）

核心功能1：识别查询是否需要联网搜索
核心功能2：为联网搜索改写查询
核心功能3：生成搜索策略

ai搜索引擎：Tavily MCP Tavily智搜（可以在modelscope上搜到）
是个协议

RAG高效召回方法（双向改写）

将用户查询改写成文档(Query2Doc)
或为文档生成查询(Doc2Query)，缓解短文本向量化效果差的问题，建立更多的联系

Q：如何进行互相使用：
tool1：query改写
too12：联网搜索
too13：问题解读
agent自主选择调用哪个工具

RAG高效召回方法（索引拓展）

4 索引拓展
1）离散索引拓展：适用关键词匹配、实体识别等技术生成离散索引
2）连续索引拓展：结合多种向量模型（如OpenAI的 Ada、智源的
BGE）进行召回，计算向量夹角
3）混合索引召回：常用将离散索引和向量索引结合，通过
ensemble Retriever实现混合召回，提升召回多样性

RAG高效召回方法(small to big)

small to big机制：
小规模内容检索，用户输入查询后，系统首先在小规模内容（如摘要
关键句或段落)中检索匹配的内容。小规模内容通常是通过摘要生成、关键句提取等技术从大规模内容中提取的，并建立索引。

链接到大规模内容
notebooklm（谷歌推荐） VS imacopilot（腾讯）
notebooklm.google.com

知识库处理

知识库可以有多个
场景：知识库健康度检查：
如何对整个知识库进行健康度检查，找出缺少的知识、过期的知识、冲突
的知识，确保知识库的质量和可靠性

1 知识库问题生成与检索优化
为知识库内容生成多样化问题，使用 BM25 算法进行文本检索优化
LLM作用：生成多样化问题，评估检索质量，优化知识库结构

2 对话知识沉淀
从用户对话中提取有价值的知识点，进行智能合并和分类
LLM作用：提取对话中的知识点，智能合并相似知识，生成结构化知识内容

3 知识库健康度检查
检查知识库的完整性、时效性和一致性，识别知识空白和冲突
LLM作用：分析知识缺失、检查过时内容、识别知识冲突、生成健康报告

4 知识库版本管理与性能比较
Embedding作用：构建向量索引，进行语义检索，支持版本间的性能评估
版本差异检测使用精确文本匹配（简化版没有使用到LLM）

Q：实际项目中知识库管理使用什么工具?
可以用Agent开发平台，比如Coze，腾讯云智能体开发平台
也可自己开发，解决个性化的问题
RAG是知识库的使用过程，包括了 R检索、A增强、G生成。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

上下文协议（MCP）Java SDK 指南

我们先通过这个类，定义一个非常简单的 MCP 工具，用来打印收到的提示词（prompt），该方法返回一个.build();});这里我们首先定义了输入的 JSON Schema，用来为用户输入建立一个清晰的契约。接着，使用该输入 Schema 来实例化一个Tool，在处理逻辑中提取出prompt参数，并最终返回包含该prompt的结果。在本文中，我们首先回顾了 MCP 及其 Java SDK 的整