RAG高级技术
RAG高级技术Q:embedding时,markdown和txt 有何区别?embedding时markdown比txt损失更小 如果是PDF PPI建议转成Q:公司做运维场景的智能体 用什么框架好?思考运维智能体有哪些功能 需搭建哪些toolRAG:从1000万众=>召回(关键词)100个=>重排(重排模型相对较大,计算量较大)推荐系统:1000万=>召回100个=>重排召回可以是多渠道的,可以
RAG高级技术
Q:embedding时,markdown和txt 有何区别?
embedding时markdown比txt损失更小 如果是PDF PPI建议转成
Q:公司做运维场景的智能体 用什么框架好?
langchain langgraph qwen-agent
思考运维智能体有哪些功能 需搭建哪些tool
RAG:从1000万众=>召回(关键词)100个=>重排(重排模型相对较
大,计算量较大)
推荐系统:1000万=>召回100个=>重排
召回可以是多渠道的,可以是向量检索或关键词
可以在 modelscope 上搜索 rerank 模型:bge-rerank,cohere-rerank,
rerank模型是把问题和答案直接的相关性进行一个打分
RAG高效召回方法
1 改进检索算法
知识图谱:利用知识图谱中的语义信息和实体关系,增强对查询和文
档的理解,提升召回的相关性
2 引入重排序 reranking
重排序模型:对召回结果进行重排,提升问题和文档的相关性,常见
的重排模型有 bge-rerank 和 cohere-rerank
bge-rerank开源,可本地部署,支持中英文,适用数据敏感、垂直
领域。
cohere-rerank商业API,云端调用,多语言(v3.0),适用快速集
成,多语言优化。
混合检索:结合向量检索和关键词检索的优势,通过重排序模型对结
果进行归一化处理,提升召回质量
3 优化查询拓展
相似语义改写:使用大模型将用户查询改成成多个语义相近的查询,
提升召回多样性。例如 LangChain 的 MultiQueryRetriever支持
多查询召回。
Query改写
rag的核心是检索和生成。如果第一步检索的质量差,那么后续的生成
质量也会降低。
用户提出的问题往往是口语化的、承接上下文的、模糊的,甚至是包
含了情绪的,所以需要将用户的口语化的查询 转换成 书面化 精确的
检索语句。
如何对不同类型的query进行改写:
通过精心设计的 prompt 来引导 LLM 完成这项任务
Query意图识别:
上下文依赖型
对比型
模糊指代型
多意图型
反问型
先让AI自动分析是哪种类型的query,再进行改写,还可以提供置信
度
rag可以用开源的,比如dify,ragflow,qwen-agent
Query + 联网搜索(识别)
核心功能1:识别查询是否需要联网搜索
核心功能2:为联网搜索改写查询
核心功能3:生成搜索策略
ai搜索引擎:Tavily MCP Tavily智搜(可以在modelscope上搜到)
是个协议
RAG高效召回方法(双向改写)
将用户查询改写成文档(Query2Doc)
或为 文档生成查询(Doc2Query),缓解短文本向量化效果差的问题,建立更多的联系
Q:如何进行互相使用:
tool1:query改写
too12:联网搜索
too13:问题解读
agent自主选择调用哪个工具
RAG高效召回方法(索引拓展)
4 索引拓展
1)离散索引拓展:适用关键词匹配、实体识别等技术生成离散索引
2)连续索引拓展:结合多种向量模型(如OpenAI的 Ada、智源的
BGE)进行召回,计算向量夹角
3)混合索引召回:常用 将离散索引和向量索引结合,通过
ensemble Retriever实现混合召回,提升召回多样性
RAG高效召回方法(small to big)
small to big机制:
小规模内容检索,用户输入查询后,系统首先在小规模内容(如摘要
关键句 或 段落)中检索匹配的内容。小规模内容通常是通过摘要生成、关键句提取等技术从大规模内容中提取的,并建立索引。
链接到大规模内容
notebooklm(谷歌 推荐) VS imacopilot(腾讯)
notebooklm.google.com
知识库处理
知识库可以有多个
场景:知识库健康度检查:
如何对整个知识库进行健康度检查,找出缺少的知识、过期的知识、冲突
的知识,确保知识库的质量和可靠性
1 知识库问题生成与检索优化
为知识库内容生成多样化问题,使用 BM25 算法进行文本检索优化
LLM作用:生成多样化问题,评估检索质量,优化知识库结构
2 对话知识沉淀
从用户对话中提取有价值的知识点,进行智能合并和分类
LLM作用:提取对话中的知识点,智能合并相似知识,生成结构化知识内容
3 知识库健康度检查
检查知识库的完整性、时效性和一致性,识别知识空白和冲突
LLM作用:分析知识缺失、检查过时内容、识别知识冲突、生成健康报告
4 知识库版本管理与性能比较
Embedding作用:构建向量索引,进行语义检索,支持版本间的性能评估
版本差异检测使用精确文本匹配(简化版 没有使用到LLM)
Q:实际项目中知识库管理使用什么工具?
可以用Agent开发平台,比如Coze,腾讯云智能体开发平台
也可自己开发,解决个性化的问题
RAG是知识库的使用过程,包括了 R检索、A增强、G生成。
更多推荐


所有评论(0)