深度智能体-智能体加强版
本文介绍了深度智能体的增强功能,主要包括:1)文件系统访问能力,包含6个类Linux命令工具;2)智能管理工具调用结果,避免上下文窗口饱和;3)可插拔的持久化后端,支持多种存储策略;4)任务委托功能,支持创建子智能体实现并行处理;5)对话历史汇总机制,自动压缩令牌数量;6)工具调用断链恢复功能,确保消息序列完整性;7)结构化待办事项跟踪系统;8)人机回环功能。这些增强使深度智能体具备更强大的文件处
1.概述
深度智能体实际是传统智能体的加强版,其基本的运行机制与传统的智能体相同,其核心就是采用工具调用循环机制,但深度智能体通过多种内置工具从而具备了增强的能力。包括访问文件系统、工具调用结果整理、可插拔持久化后端、任务委托、对话历史汇总、工具调用断链恢复、代办事项跟踪和人机回环,下面分别以上工具和增强能力进行说明。
2.访问文件系统
该能力为智能体直接开放了本地文件系统的访问能力,从而使文件在深度智能体中成为一等公民。该能力由6个工具构成,分别是:
1)ls:同linux中的ls命令,调用结果是目录下的文件列表)
2)read_file:读取指定行书的文件内容,对于大文件支持偏移和最大行数限制
3)write_file:创建新文件并写文件恩荣
4)edit_file Perform:修改文件内容。基于精准匹配进行字符串替换。)
5)glob:基于正则表达式匹配查找文件。与linux find命令类似
6)grep:同 linux中的grep命令,用于从文件中查找与正则表达式匹配的内容
3.工具调用结果整理
工具调用结果整理时指当调用工具时的返回结果超过词元阈值时,自动把结果转储到文件系统,防止上下文窗口饱和。
具体实现原理如下:
检查工具调用时返回结果的大小,并与事先设定的阈值进行比较,如果未超过阈值则不做处理,否则把结果写入到文件中,并用对文件的引用(比如路径)来内容,智能体后继可根据需要从文件中读取内容。
4.可插拔持久化后端
该能力与linux的VFS类似,通过提供抽象的统一接口屏蔽不同的存储策略。智能体可根据场景选择不同的持久化后端。可用的持久化后端包括:
1)基于状态的后端。文件被保存中智能体的状态中,使用检查点实现持久化,仅支持线程级别,不能跨对话。适用于保存临时文件。
2)基于文件系统的后端。从磁盘读写文件,自动与文件系统功能整合,并通过路径校验、防止符号链接和设置大小限制保证安全。
3)基于store的后端。使用langraph中的store实现,支持跨对话共享,适用于长期记忆和知识库。
4)混合后端。基于路径使用最长前缀匹配算法把持久化请求路由到不同的后端。比如把'/'路由到基于状态的后端, /store路由到基于store的后端,……
5.任务委托
为执行复杂的多步任务,创建不同的子智能体处理不同的任务。
任务委托有如下优点:
1)实现上下文隔离,子智能体有自己的上下文,并且不会对主智能体上下文形成干扰
2)支持并行运算,不同的子智能体可并行运行,可以提高处理效率
3)实现专业的分工。不同的子智能体可配置不同的工具集、模型、提示词等。
4)词元利用率高。子智能体上下文被压缩成一个结果
任务委托工作原理如下:
1)主智能体有一个名字为task的工具,该工具可以创建子智能体,子智能体都是无状态的
2)主智能体在处理复杂任务时,调用task工具创建子智能体并且使用专有的上下文
3)子智能体自主执行直至结束,并返回一条最终的结果给主智能体
创建子智能体时可以直接使用缺省智能体,也可以定制专业智能体。缺省智能体是携带文件系统工具的通用智能体;可以通过subagents参数对缺省智能体进行定制生成专业智能体,比如检查代码、执行测试。
6.对话历史汇总
深度智能体在使用令牌过多时,可以对对话历史进行压缩。
对话历史汇总原理如下:设置令牌阈值为 170,000 ,当令牌数超过阈值时把最近6条消息原封不动的保留下来,对其他的历史聊天信息调用大模型进行汇总。
使用对话历史汇总可以在保留最关键信息的前提下,把相关性小的信息进行压缩,从而减少令牌数量,这个过程对于深度智能体来说是透明的。
7.工具调用断链恢复
工具调用断链恢复可以在工具调用返回前结果签被中断或取消时修复历史消息。体现在智能体的执行过程中就是智能体看到了 AIMessage中有tool_call信息,后没有后继与之匹配的ToolMessage,这样的消息序列会给大模型造成困惑,所以需要合成ToolMessage并说明工具调用被取消了,从而保证大模型看到的是一个正常的消息序列。
8.待办事项跟踪
深度智能体使用write_todos工具去跟踪和维护结构化的任务列表,每个任务都有自己的状态,包括(pending, in_progress, completed)三个状态,代办任务列表在智能体的状态中保存。
代办事项跟踪能力使智能体可以处理复杂的多步任务,适用于需要规划并长期执行的任务。
9.人机回环
无需多言了,前面在langgraph的图和智能体中已经多次提及。
更多推荐



所有评论(0)