RAG翻车现场终结者！Agentic-R双视角打分，小白也能上手的大模型检索神器

《Agentic-R: Learning to Retrieve for Agentic Search》提出了一种面向智能搜索的新型检索器训练框架。针对传统RAG在多跳推理任务中的局限性，该框架同时考虑局部查询-段落相关性和全局答案正确性，通过双视角打分和双向飞轮迭代优化。实验表明，在7个数据集上平均提升2-3个EM分数，搜索轮数减少10-15%，有效解决了高相似但误导性段落的问题，显著提升了多轮

小天才学习机打游戏

346人浏览 · 2026-01-28 17:25:25

小天才学习机打游戏 · 2026-01-28 17:25:25 发布

1 背景：传统 RAG 的“单跳”天花板

传统检索增强生成（RAG）=「一次检索 + 一次生成」。
当问题需要多跳推理（例：A 比 B 大几岁？→ 先查 A 出生年 → 再查 B 出生年）时，单跳检索往往“一步错、步步错”。

图1 经典 Agentic Search 流程

Agentic Search 把 RAG 升级成「多轮推理-检索」循环：LLM 像侦探一样，边思考边查资料，直到凑齐证据链。
然而，检索器仍沿用老掉牙的“语义相似度”方案——只关心“这段文字像不像答案”，不关心“这段文字能不能把推理引向正途”。于是高相似但误导性的段落被当成宝贝，最终答案翻车。

2 方案：双视角打分 + 双向飞轮

人大高瓴 & 百度提出一套面向智能搜索的检索器训练框架。与传统单轮检索增强生成（RAG）只关注“局部段落效用”不同，同时考虑：

局部查询-段落相关性
全局答案正确性

两者共同衡量段落在多轮智能搜索中的真实效用。

图2 训练框架

2.1 训练数据怎么来？

给定一条 Agent 轨迹
T = {t₁,q₁,D₁, … , tₙ,A}
对每个中间查询 qᵢ，从语料里先捞 20 条候选段落 pᵢ,₁…pᵢ,₂₀，然后打两份分：

Local Relevance（LR）
用 Qwen2.5-72B 做「列表式」相关性打分（0–100），鼓励段落直接回答 qᵢ。
若能推断出 qᵢ 的“子答案”，一并喂给 LLM 做参考，减少幻觉。
Global Answer Correctness（GAC）
把 pᵢ,ⱼ 塞回 Agent，让它跑完后续所有轮次，看最终答案是否命中标准答案（EM=1/0）。
这一步把“局部有用”升级为“全局正确”，过滤掉会把推理带歪的高相似段落。

排序规则
先按 GAC 降序，再按 LR 降序；Top-1 且 GAC=1 & LR≥60 为正例，其余做负例，每查询凑 16 条样本。

2.2 模型怎么训？

输入：原始问题 Q + 当前查询 qᵢ，用 [SEP] 拼接，不引入历史查询（实验表明历史查询会引入噪声）。
损失：对比学习，in-batch + 跨 GPU 负样本，温度 0.01。
初始化：直接热启 E5-base，2 epoch，lr 2e-5。

2.3 飞轮怎么转？

算法1 迭代优化伪代码

第 k 轮用 Agentic-Rₖ₋₁ 做环境，PPO 训出更强 Agentₖ；
用 Agentₖ 产生新轨迹，构造更高质量训练集；
用新数据训出 Agentic-Rₖ；
重复 2 轮即收敛。

3 Agentic-R 用两轮迭代，让检索器“长眼睛”

Agentic-R 在 7 个数据集、3 种不同搜索 Agent 上平均提升 2–3 个绝对 EM 点；同时让搜索轮数**减少 10–15%**。
两轮迭代后收益饱和，继续训反而轻微掉点。

表1 主实验结果（7 个 QA 数据集，EM 分数）

图3 平均搜索轮数对比

图4 迭代轮数 vs 性能

4 一张图看懂“为什么 E5 会翻车”

表6 Case Study（HotpotQA）

E5 把“Get Shorty”当成第三部大片，结果一路检索“莫须有”的 honky-tonk；
Agentic-R 直接锁定“Urban Cowboy”+“Gilley’s Club”，一步直达正确答案 Mickey Gilley。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【拥抱AI】OpenClaw - 2026年GitHub最火的开源项目

2048 AI社区

AI小说生成器

然而，借助现代AI技术和开发工具，我们在短短30分钟内就完成了从概念到成品的全过程。未来的文学世界，将是人类智慧与AI技术完美融合的舞台。那些善于利用AI工具的作家，将拥有更大的创作优势。这是一款基于人工智能技术的小说创作辅助工具，可以帮助作者快速生成小说大纲、章节内容，并提供流畅的阅读体验。系统内置了先进的上下文管理机制，确保在长篇创作过程中不会丢失关键信息，保持情节的连贯性。即使是写作新手，也