图片

RAG 系统生成不准确或无实用价值的回答是一个较为普遍的现象。
今天,我们将探讨如何借助 Cleanlab Codex 改善这一状况。Cleanlab Codex 通常被应用于生产环境中,能够自动识别并修正 RAG 输出中的错误内容。
图片

下文我们详细剖析之。

—*1*

Agentic RAG 工作流架构设计

第一、Agentic RAG 工作流使用的技术栈

  • 使用 LlamaIndex 进行编排;
  • 使用 Milvus 作为自托管的向量数据库;
  • 使用 Cleanlab Codex 验证回答;
  • 使用 OpenRouterAI 访问最新的 Qwen3 C。

第二、Agentic RAG 工作流架构设计

图片

  • LLM 处理查询以选择工具;

  • 将查询转换为正确的格式(文本/SQL);

  • 执行工具并获取输出;

  • 生成带有丰富上下文的回答;

  • 使用 Cleanlab 的 Codex 验证回答

—*2*

Agentic RAG 工作流代码实现

第一、设置 LLM

我们将使用通过 OpenRouter 提供的最新 Qwen3。确保 LLM 支持工具调用,以便无缝执行。

图片

第二、设置 SQL 查询引擎

自然语言到 SQL 引擎可以将普通查询转换为 SQL 命令,从而实现轻松的数据交互。

图片

第三、设置 RAG 查询引擎

使用 Docling 将 PDF、DOCX 或任何文档转换为 Markdown 格式,以便进行向量存储。查询引擎从 Milvus 中获取上下文,将其与查询结合,然后发送给 LLM 以获取回答。

图片

第四、设置工具

现在,是时候设置并使用我们上面定义的两个查询引擎作为工具了。我们的 AI 智能体将智能地将查询路由到正确的工具。

图片

第五、Cleanlab Codex 验证

接下来,我们通过几行代码将 Cleanlab Codex 集成进来,以评估和监控 RAG 应用。

图片

第六、创建 Agentic 工作流

一切准备就绪后,让我们创建我们的 Agentic 路由工作流。

图片

第七、启动工作流

一切准备妥当,是时候激活我们的工作流了。我们首先为 LLM 配备两个工具:文档和文本到 SQL 查询。之后,我们启动工作流。

图片

第八、Streamlit 用户界面

为了提升用户体验,我们将所有内容都展示在一个简洁且交互式的 Streamlit 用户界面中。

图片

在提示词后,注意应用会在生成的回答上显示一个信任分数。这对于容易出现不准确和幻觉的 RAG/AI 智能体工作流来说非常重要。

图片

除此之外,我们还能获得每次测试运行的具体评估指标,以及详细的见解和推理:

图片

大模型未来如何发展?普通人能从中受益吗?

在科技日新月异的今天,大模型已经展现出了令人瞩目的能力,从编写代码到医疗诊断,再到自动驾驶,它们的应用领域日益广泛。那么,未来大模型将如何发展?普通人又能从中获得哪些益处呢?

通用人工智能(AGI)的曙光:未来,我们可能会见证通用人工智能(AGI)的出现,这是一种能够像人类一样思考的超级模型。它们有可能帮助人类解决气候变化、癌症等全球性难题。这样的发展将极大地推动科技进步,改善人类生活。

个人专属大模型的崛起:想象一下,未来的某一天,每个人的手机里都可能拥有一个私人AI助手。这个助手了解你的喜好,记得你的日程,甚至能模仿你的语气写邮件、回微信。这样的个性化服务将使我们的生活变得更加便捷。

脑机接口与大模型的融合:脑机接口技术的发展,使得大模型与人类的思维直接连接成为可能。未来,你可能只需戴上头盔,心中想到写一篇工作总结”,大模型就能将文字直接投影到屏幕上,实现真正的心想事成。

大模型的多领域应用:大模型就像一个超级智能的多面手,在各个领域都展现出了巨大的潜力和价值。随着技术的不断发展,相信未来大模型还会给我们带来更多的惊喜。赶紧把这篇文章分享给身边的朋友,一起感受大模型的魅力吧!

那么,如何学习AI大模型?

在一线互联网企业工作十余年里,我指导过不少同行后辈,帮助他们得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑。因此,我坚持整理和分享各种AI大模型资料,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频。在这里插入图片描述

学习阶段包括:

1.大模型系统设计
从大模型系统设计入手,讲解大模型的主要方法。包括模型架构、训练过程、优化策略等,让读者对大模型有一个全面的认识。

在这里插入图片描述

2.大模型提示词工程
通过大模型提示词工程,从Prompts角度入手,更好发挥模型的作用。包括提示词的构造、优化、应用等,让读者学会如何更好地利用大模型。

在这里插入图片描述

3.大模型平台应用开发
借助阿里云PAI平台,构建电商领域虚拟试衣系统。从需求分析、方案设计、到具体实现,详细讲解如何利用大模型构建实际应用。

在这里插入图片描述

4.大模型知识库应用开发
以LangChain框架为例,构建物流行业咨询智能问答系统。包括知识库的构建、问答系统的设计、到实际应用,让读者了解如何利用大模型构建智能问答系统。
在这里插入图片描述

5.大模型微调开发
借助以大健康、新零售、新媒体领域,构建适合当前领域的大模型。包括微调的方法、技巧、到实际应用,让读者学会如何针对特定领域进行大模型的微调。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.SD多模态大模型
以SD多模态大模型为主,搭建文生图小程序案例。从模型选择、到小程序的设计、到实际应用,让读者了解如何利用大模型构建多模态应用。
在这里插入图片描述

7.大模型平台应用与开发
通过星火大模型、文心大模型等成熟大模型,构建大模型行业应用。包括行业需求分析、方案设计、到实际应用,让读者了解如何利用大模型构建行业应用。

在这里插入图片描述
在这里插入图片描述

学成之后的收获👈

全栈工程实现能力:通过学习,你将掌握从前端到后端,从产品经理到设计,再到数据分析等一系列技能,实现全方位的技术提升。

解决实际项目需求:在大数据时代,企业和机构面临海量数据处理的需求。掌握大模型应用开发技能,将使你能够更准确地分析数据,更有效地做出决策,更好地应对各种实际项目挑战。

AI应用开发实战技能:你将学习如何基于大模型和企业数据开发AI应用,包括理论掌握、GPU算力运用、硬件知识、LangChain开发框架应用,以及项目实战经验。此外,你还将学会如何进行Fine-tuning垂直训练大模型,包括数据准备、数据蒸馏和大模型部署等一站式技能。

提升编码能力:大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握将提升你的编码能力和分析能力,使你能够编写更高质量的代码。

学习资源📚

  1. AI大模型学习路线图:为你提供清晰的学习路径,助你系统地掌握AI大模型知识。
  2. 100套AI大模型商业化落地方案:学习如何将AI大模型技术应用于实际商业场景,实现技术的商业化价值。
  3. 100集大模型视频教程:通过视频教程,你将更直观地学习大模型的技术细节和应用方法。
  4. 200本大模型PDF书籍:丰富的书籍资源,供你深入阅读和研究,拓宽你的知识视野。
  5. LLM面试题合集:准备面试,了解大模型领域的常见问题,提升你的面试通过率。
  6. AI产品经理资源合集:为你提供AI产品经理的实用资源,帮助你更好地管理和推广AI产品。

👉获取方式: 😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐