RAGFlow入门到实战(五)RAGFlow 的Agent智能助手应用
接下来,让我们赶快看看 RAGFlow 的Agent智能助手如何应用吧。
接下来,让我们赶快看看 RAGFlow 的Agent智能助手如何应用吧。
Agent 智能助手
步骤1:创建Agent
首先,我们选中顶部导航栏中的“Agent”菜单项,点击右上角的“Create Agent”,如下图所示:
接着,我们选择 RAGFlow 内置的一个基于知识库检索问答Agent模版,如下图所示:
点击Agent版本,输入Agent名称,比如test,即可自动创建出来一个Agent。
基于该 Agent 模板,我们稍加修改,开始节点编排,如下图所示:
点击加号,即可添加选择任意一个新节点,如下图所示:
搜索Agent编排,如下图所示:
检索本地知识库编排,如下图所示:
除了在上图中添加本地已构建的专属知识库——设计模式以外,我们再尝试添加一个Github网站搜索工具,并设置高级参数,如下图所示:
然后,在右上角顶部的点击“保存”按钮。
此时,就可以点击“运行”,开始尝试运行Agent应用啦。。。
在右下角我们输入提示词:什么是设计模式,按Enter回车键 或者 点击右下角的“搜索”小箭头图标,看看Agent表现效果如何,具体如下图所示:
在running…的紧挨着的上方右侧第一个“笔记本”小图标按,支持点击查看Agent实时运行日志Log,如下图所示:
温馨提示:
关于 Agent 节点(即,大模型 LLM)的系统提示词,小伙伴们可以根据各自需求自定义编写哈,这里我建议大家可以先参考一些开源的系统提示词 Prompt 模版,等自己熟练掌握了系统提示词 Prompt 之后,自己再按照自己的想法来自由编写。简而言之,我们要站在巨人的肩膀上,先模仿,再超越嘛!切忌闭门造车!
文件管理
文件管理应用模块,主要是用于下载和预览已经上传的文件资料。
点击上图中“操作”这一列下面的小眼睛图标,即可支持在线预览已上传的文件内容,如下图我们可以清楚的看到,已上传解析处理的《java设计模式》pdf文档,共计有415页。
常见问题与解决方案
问题1:RAGFlow 登录报错502(Bad Gateway)
如下图所示:
原因分析:
502状态码(Bad Gateway)是一种HTTP协议的服务端错误状态代码,表示作为网关或代理的服务器从上游服务器接收到的响应无效。
这说明RAGFlow有个Base基础服务没有成功启动,我们需要检测一下后端是否正常。
解决方案:
进入docker目录下,重启执行安装基础服务,命令行如下:
sudo docker-compose -f docker-compose-base.yml --profile infinity up -d
其中,使用 --profile infinity参数时,只有里配置了infinity配置文件的服务会被启动。
具体如下图所示:
问题2:构建知识库时,上传文档在解析过程中报错:Page(109~121): [ERROR]Generate embedding error:Function ‘batch_encode’ timed out after 5 seconds and 2 attempts.
如下图所示:
原因分析:
从错误信息来看,batch_encode 函数在尝试生成嵌入时超时了。这可能是由于处理的数据量较大,或者函数本身的性能问题导致的。
解决方案:
在“切片方法”中,结合硬件性能,适当调小“任务页面大小”数值。这里,我设置为1,成功解决了该问题。小伙伴们可供参考。
关于"General" 分块方法说明:
支持的文件格式为MD、MDX、DOCX、XLSX、XLS (Excel 97-2003)、PPT、PDF、TXT、JPEG、JPG、PNG、TIF、GIF、CSV、JSON、EML、HTML。
此方法将简单的方法应用于块文件:
系统将使用视觉检测模型将连续文本分割成多个片段。
接下来,这些连续的片段被合并成Token数不超过“Token数”的块。
关于“任务页面大小”参数说明:如果使用布局识别,PDF 文件将被分成连续的组。 布局分析将在组之间并行执行,以提高处理速度。 “任务页面大小”决定组的大小。 页面大小越大,将页面之间的连续文本分割成不同块的机会就越低。
当然,GitHub官网上关于该问题也有一些其他的解决方案可供小伙伴们参考,具体如下图所示:
小结
本系列带领小伙伴们一起初步探索体验了 RAGFlow 的强大功能。
总体而言,RAGFlow 是一个开源的检索增强生成(RAG)引擎,目前已构建提供了一个轻量级且相对完整的AI应用框架,通过知识库管理、智能搜索、Agent编排、文件处理四大核心模块,实现企业级知识驱动应用。其架构融合向量检索、Rerank重排序与LLM生成,精准匹配用户查询与知识库内容,支持多模态文档解析与自定义工作流。通过优化检索-生成链路,显著提升答案准确率、降低幻觉,并保障数据安全与可扩展性,适用于智能客服、文档分析等场景。
当然,RAGFlow 仍有提升空间:一是内置的工具插件与 Agent 模板数量还不够丰富;二是Agent编排界面的操作便捷性,相较于Dify工作流编排稍显逊色。当然,每个产品定位和在不同发展阶段各有侧重点,RAGFlow 当前的核心优势在于构建知识库,并深度结合大模型(如DeepSeek-R1)生成精准、上下文相关的回答。
如何系统学习掌握AI大模型?
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份
全面的AI大模型学习资源
,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享
!
1. 成长路线图&学习规划
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
2. 大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
3. 大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
4. 大模型行业报告
行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
5. 大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
6. 大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以
微信扫描下方CSDN官方认证二维码
,免费领取【保证100%免费
】
更多推荐
所有评论(0)