【AI大模型】Dify与RAGFlow知识库召回能力大比拼:测试结果与优化策略,小白也能轻松上手!
本文对比测试了Dify和RagFlow两个知识库管理平台的召回能力。通过使用省份地名和邮编对照文档进行测试,发现两者默认分块策略存在问题,导致内容被切割影响召回准确率。通过自定义分块标志,将准确率提升至98%左右。最终选择Dify+RagFlow组合方式,利用Dify的工作流能力和RagFlow的召回能力,满足应用需求,为开发者提供了实用的知识库构建方案。
功能完善上面不断卷卷卷
目前,Dify和RagFlow着实让人眼前一亮,而且各自都在不断更新,持续优化,之前在做Dify工作流的时候,顺带做了其知识库的召回应用,但是一直没有达到预定的效果,即使是对于简单的知识库;无奈后来选择了RagFlow进行知识库的召回工作,并将其集成到了Dify中,同时利用Dify强大的工作流能力和RagFlow强大的知识库召回能力,满足了应用的需求。
随着两者不断更新,在工作流方面Ragflow也有了很大的突破,同样Dify的知识库召回准确性也慢慢在提升。
本文将使用一份简单的文档,里面记录了全国各个省份的地名和邮编对照关系,这些地名和邮编对都是随机分布和乱序呈现的,现将该文档使用Dify和Ragflow两个知识库管理方式进行切分,分别进行召回测试,择优使用。
Dify中创建知识库
在Dify中创建知识库,具体创建方式很简单,为了节省大家时间,这里直接忽略,注意分片大小和切分方式,在创建完成之后进行召回测试,测试问题为:“天水的邮编”,可以看到在第分块就已经显示出来了,这种召回非常准确了,只是顺序相对比较靠后,这种结果交给模型处理是没有任何问题的。
缺点就是,分块选择了默认的换行分割,导致同一部分的描述会被切割成不同的分块,这样对召回准确度的影响非常大。
Ragflow创建知识库
在Ragflow中创建知识库,然后进行对上传的稳定进行解析,等完成之后,做同样的测试,同样的问题,可以看到找回的结果在块中显示更加靠前,整体的召回率也更加准确,但同样存在同一部分内容被切割成两块的问题。
切割分割限定
在上述方式测试完成之后,对知识库的分块策略做了更改,切片方法还是General,但是将文本的分段标志改成自己定义的符号,前提是要对文档预先进行人为处理,将同意部分进行自定义符号的分割,然后交给平台进行切割,最后,达到准确的召回,经过多轮测试,准确率能达到98%左右。
在进行测试对比后,选择Dify+Ragflow的方式进行应用编排,几乎能满足所有预期。
最后
为什么要学AI大模型
当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!
DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。
与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】

AI大模型系统学习路线
在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。
但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。
AI大模型入门到实战的视频教程+项目包
看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
海量AI大模型必读的经典书籍(PDF)
阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
600+AI大模型报告(实时更新)
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
AI大模型面试真题+答案解析
我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】

更多推荐
所有评论(0)