AI Agent智能体系统路由技术全解析:从规则到LLM的四种实现模式对比与应用指南!
文章介绍了智能体系统中路由模块的作用与四种实现模式。路由模块主要负责分发、调度、仲裁及兜底,理解用户意图并引导到相应处理流程。四种模式包括:基于规则(响应快但泛化性差)、基于小模型(平衡准确度和响应速度)、基于大模型(无需预先工作但响应慢)和基于嵌入(通过向量化检索实现语义理解)。实际应用中建议先通过大模型模式快速验证,再根据需求选择其他模式优化,需在理解效果、响应时延和实现成本间取得平衡。
本篇来聊聊智能体系统里常见的模块:路由。内容包含路由的作用、实现路由的4种常见模式及其对比。
路由模块的作用
企业都在拥抱AI,要么想把现有系统AI化,要么想用智能体重构。在建设智能体的过程中,大概率要引入路由模块。
什么是路由?现实生活中其实有很多关于路由的例子。比如家里上网用的路由器,一个宽带光猫只能连一台设备,靠路由器把宽带信号分发给电脑、手机、平板多个设备上。比如医院大厅的导诊台,把不同诉求的病人引导到不同的科室。简而言之,路由最主要的作用就是分发调度、仲裁及兜底。
分发的前提要先完成用户意图的理解。即需要分析用户的输入代表什么意图,综合考虑上下文信息包括前序交互内容、当前环境感知及状态信息。进而做出动态决策,把请求导流到不同的专门处理流程。只有准确的意图理解才能做到精准分发。
除此之外,用户输入query可能不完整、可能缺少主语宾语、可能包含多个意图、甚至可能无效,因此为了正确识别用户输入query,可能还会涉及query澄清、query改写、query多意图拆分、query兜底回复。

比方说在电商客服智能体里,客户的输入可能是查看物流、改定单、退货、投诉等,为了能快速有效处理请求,需要路由模块精确识别客户的输入并转到对应的模块。实际落地当中,路由模块本身就可以是一个智能体,下游模块是另外的智能体,也就是多智能体架构。此时路由智能体就充当了多智能体的主agent作用。
如果熟悉分布式或微服务架构的话,你可能会想到网关模块。没错,路由跟网关很类似,相同的是两者都是为了让请求方以无差别的方式请求整个系统,不用知道系统背后的模块细节,同时让响应方专注处理应该由本模块响应的有效请求。两者还承担了转换下游不同模块的返回数据的协议和格式。
和网关模块不同的是路由模块更多会用大模型技术来实现,路由的分发决策做的好不好和请求的领域语义理解息息相关,而网关只专注网络协议等技术问题,不耦合业务领域语义。
路由的常见实现模式
前面讲到,路由之所以能做出合理的分发决策是因为能理解用户输入的内容,最常见的输入内容是自然语言的文本表达,如“我要退货”。因此根据意图分析理解的手段可以把路由实现模式分为以下四种模式:
基于规则的路由:
在机器学习流行以前,这是主要的一种实现方式,也是早期NLP的常见做法。大致实现过程是:预先枚举定义出一系列的说法规则并编译成对应引擎的格式,比如正则表达式、前缀树、开源或自研的规则引擎。然后在运行时对用户输入进行匹配,按照阈值计算是否满足。最简单的匹配是关键词匹配、正则匹配。复杂一点利用前缀树或规则引擎进行匹配。
这种模式的好处是比较容易组织代码完成规则的预先定义,运行时的响应速度快,比下面三种模式的响应时间都快且结果可预知。不好的点是泛化性不足,遇到用户灵活表达时一定会捉襟见肘,显得不那么智能。
基于小模型的路由:
这里说的小模型是相对大语言模型的百亿千亿参数而言。换句话说小模型的参数也可以达到亿级别。小模型也是采用机器学习方式训练出来的模型。路由任务属于判别和分类这类模式。既然是机器学习,模型训练一样需要经过收集数据样本、数据标注、在基模上监督微调。
小模型在泛化性方面比规则模式高很多,在响应时间方面比大模型快很多。因此是实际项目落地的首选。毕竟分类这个任务不需要用到大模型的生成能力。
基于大模型LLM的路由:
我们都知道大模型能做很多事情,自然包括分类任务。用大模型来做分类可以直接写提示词prompt,也可以继续做SFT微调。写提示词要考验分类种类的边界设计、典型样例的选取,同时要写清楚需要让大模型输出哪种格式的结果。往往以某种约定的标识符或指令呈现,比如json格式。
举例:用户输入的内容可能是“xx商品双11有哪些优惠”、“我看要下订单xx的物流进度”、“我要退货”,可以用提示词调用大模型对用户输入进行分类,根据下游的模块情况给出候选分类:商品信息、订单、物流、售后、其他。
大模型模式的好处是不用预先做工作,用提示词就可以完成冷启动,验证业务流程。根据业务要求的效果指标再看是否需要微调。当然微调需要大模型训练环境,大概率需要算法策略人员参与。另外不好的地方就是响应时间长达几秒。遇到bad case不好修复,修改提示词往往会按下葫芦起了瓢。
基于嵌入Embedding的路由:
嵌入模式本质就是根据输入内容进行向量化检索。把用户请求内容进行向量化,查询向量库,得到语义最相似的结果,根据结果分发到对应模块。这个模式在传统基于关键词检索的基础上加入了语义理解,也就是说能对用户输入的内容给予语义层面的分析。
嵌入的前提是要用RAG技术先建立向量库,需提前准备样本,每个样本包括用户输入及对应分类。算是RAG技术诸多应用场景的一个。对比前面大小模型的模式,嵌入用到的技术组件都比较成熟了,不太需要专门的算法策略人员,靠软件工程人员也能完成落地。
四种模式的比较
| 模式 | 准确度 | 响应时间 | 落地复杂度 | bad case修复 | 注意事项 |
| 规则路由 | 低 | 毫秒级 | 容易 | 容易 | 适合输入简单,准确度要求低的场景 |
| 小模型路由 | 高 | 秒级以下 | 中等 | 中等 | 需要算法工程师参与,依赖数据样本质量 |
| 大模型路由 | 高 | 几秒级 | 容易 | 难 | 依赖基础大模型效果 |
| 嵌入路由 | 中 | 秒级以下 | 中等 | 中等 | 依赖向量计算服务、依赖数据样本质量 |
结语
路由模块是自适应智能体系统设计中的关键控制机制,路由模块可以在智能体流程里的开始或中间的多个节点实现。可以用作分类用途,也可以用来选取调用合适的工具。
在实际项目情况,一般建议先用大模型模式采用提示词路由快速验证分发能力,跑通流程。如果对精确度有更高要求,可以使用嵌入路由和小模型路由进行专门优化。实际项目里可能需要搭配着几种路由一起使用。比如需要对bad case做快速干预修复时可能就会用到规则路由或者嵌入嵌入路由。如果团队有算法人员,推荐采用小模型模式,基于自身业务领域的样本进行SFT微调。从响应时间和维护成本看,一般不推荐基于大模型基模来做微调。
路由模块跟业务紧密相关,随着业务发展需要不断迭代。看似容易,但需要不停在理解效果、响应时延、实现成本之间求得最佳平衡。
如何学习AI大模型?
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

更多推荐



所有评论(0)