RAG的机制决定了其执行流程比较死板,而Agent更符合人类的思维模式。

在RAG检索增强系统中,有一个很重要的概念就是语义相似度检索,其流程根据用户问题先去知识库中检索相关文档,然后再丢给模型做增强。

但在真实的业务实践过程中发现了一个问题,具体表现上是多轮对话的关联性问题,实际上是语义理解问题;这个问题产生的场景就是在多轮对话过程中无法准确理解每次对话之间的关系,但这个是由RAG的流程所决定的,无法避免,或者说无法完全避免。

多轮对话中的语义理解问题

RAG的处理流程就是先检索,再增强,这是由RAG的特性所决定的;但是为了保证多轮对话的连贯性,因此在实际的处理过程中会添加记忆功能,使用记忆拼接上下文,使模型能够更好的理解和处理用户问题。

但是,拼接上下文毕竟是属于第二步,第一步是需要先使用语义相似度检索文档;这里有一个问题就是,上一个问题和下一个问题可能是完全无关的,也可能是紧密相关的。

因此,两种情况就会导致召回不同的文档,特别是在两次语义相关,但又不完全相关的情况下;这样说可能很多人都不明白什么意思,所以我们就用具体的例子来看。

比如说,第一个问题是怎么做西红柿炒蛋?然后模型巴拉巴拉一堆告诉你怎么做;然后,第二个问题是怎么才能做得更好?

这时针对这两个问题来说,其是有语义关联性的,特别是在有记忆功能的情况下,大模型也能理解你说的怎么才能做的更好是什么意思。

但在召回阶段,两个问题之间的语义关联性就不是很明显了;而根据相似度召回,两个问题召回的文档也基本上可以说是完全不搭嘎。

所以,怎么解决这个问题?

在前面的文章中有聊到过这个问题,解决方案就是在做召回时,先对问题进行改写,改写时使用历史记录作为上下文,这样就可以让模型更好的理解当前的语境,然后理解相应的问题并给出一个更合理的问题进行数据召回。

但这里又带来了一个新的问题,就是这种召回方式虽然保证了多轮对话之间的语义相关性;但如果两轮对话是完全独立的对话怎么办,即两个问题完全没任何关系;这样就会让上一个问题污染到下一个问题的召回精度。

还一个更严重的问题是,两个问题之间有关联关系,但从语义上又区分不出来的场景。

举例来说,第一个问题是我要做西红柿炒蛋,第二个问题是应该去那个菜市场买菜。

这两个问题有关联性吗?肯定是有的,但你说它可以没有关联性吗?当然也可以。

所以这种情况下,应该怎么办?

如果把两个问题合在一起改写出一个新问题,但用户的本意可能是两个完全独立的问题;但如果不进行改写,用户的本意也可能是两个相关性问题。

这种情况如果从用户的角度来说,只需要把问题问的再具体一些就行了;但问题是我们无法控制用户的行为。

所以,如果从RAG的角度来考虑这个问题,这个问题基本上是无解的,只能去约束用户的行为;但如果换个思路,使用智能体来实现,由智能体自己去判断是否需要进行数据召回,还是利用现有的内容进行回复,这样就可以避免这个问题。

而产生这个问题的原因就是RAG的机制和我们人类思考模型的区别;RAG的机制就是,不论三七二十一,我先去捞一遍文档;但人类的思考模式是,先看能不能解决问题,如果解决不了再去查文档。

所以,从这一点来看智能体更符合人类的思维模式,而RAG相对来说就比较死板。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》下方扫码获取~
在这里插入图片描述

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
在这里插入图片描述

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
在这里插入图片描述

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
在这里插入图片描述

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
在这里插入图片描述

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
在这里插入图片描述

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

图片

以上资料如何领取?

在这里插入图片描述

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

图片

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!
在这里插入图片描述
在这里插入图片描述

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

以上全套大模型资料如何领取?

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐