1. AI 智能体(Agent)热度不减,但不少系统都有个扎心的共同点 —— 有 “健忘症”。特别是上下文内容较长时,这一问题会更明显:它们没有长期、连贯的记忆能力,不仅没法深入理解用户,连持续的上下文关联都建立不起来,更别说提供个性化服务了,这直接困住了 AI 智能体的潜力,也影响了用户的使用感受。

memory_graph.png

Memory是Agent系统中重要的组成部分,因此如何为AI智能体构建一个类人记忆系统,从而设计出类人智能体(Human-like Memory for Agents)使Agent具备长期且清晰的记忆,是当前Agent研究的一个热门方向。

— 1 核心工作流程 —

让Agent的每一次回答都不是一次性的、孤立的计算

本文介绍的便是一个类人记忆系统的架构设计,共分为三个层次,首先通过架构图了解整个系统的核心工作流程:

1.  用户查询 (User Query):一切始于用户的输入。用户向AI智能体提出一个问题或指令。这可以是任何形式的交互,比如“上次我们讨论的项目进展如何了?”

2.  调用记忆 (Access Memory):这是整个架构的魔法所在。Agent的核心由一个强大的大语言模型驱动。但它并非孤立地处理问题,而是首先连接到Memory记忆系统。它会检索与当前查询相关的历史对话、文档、实体关系等一切信息。

3.  生成响应 (Generate Final response):在“回忆”起所有相关上下文之后,AI智能体将这些记忆与当前的用户查询结合起来,进行深度理解和推理,最终生成一个高度相关、充满上下文感知、且更加智能的最终响应。

这个流程确保了AI的每一次回答都不是一次性的、孤立的计算,而是基于不断积累和学习的知识库。而这个架构最精妙的设计,在于它模仿了人类记忆的加工方式,将原始信息层层递进,抽丝剥茧,最终形成结构化的知识和高度抽象的总结。

— 2.1 Level 1: EPISODES — 

情节记忆层 - 原始数据

这一层是记忆金字塔的基石,负责记录所有未经处理的原始交互数据。它就像我们大脑中的“海马体”,负责短期存储我们经历的每一个具体情节。

文档 (Documents):智能体读取过的所有外部文件,如PDF报告、网页、知识库文章等。

对话 (Conversations):与用户之间的完整聊天记录,保留了最原始的交互上下文。

JSONs:结构化数据,可能来源于API调用结果或其他外部系统的数据。

作用:这一层保证了信息的完整性和可追溯性。所有的高级记忆都源于此,当需要核对事实或查找原始出处时,可以随时回溯到这一层。

— 2.2 Level 2: ENTITIES— 

实体关系层 - 结构化知识

如果记忆只停留在原始数据,那就像拥有一座图书馆却不知道书在哪里、讲了什么。Level 2的作用就是对这些原始数据进行第一次提炼,构建一个结构化的知识图谱。

实体 (Entities):系统自动从Level 1的数据中识别出关键的概念,如图中提到的“Alice”、“Bob”,也可能是项目名称、公司、地点等。

关系 (Relationships):更进一步,它会分析并建立这些实体之间的联系。例如,系统能理解“Alice 管理 Bob”、“项目A 属于 团队B”这类关系。

作用:这一层将杂乱无章的信息转化为结构化的知识。智能体不再需要每次都全文检索海量文本,而是可以直接查询这个“关系网络”,快速找到关键信息点及其联系,极大地提升了信息检索的效率和准确性。

— 2.3 Level 3 COMMUNITIES — 

社群摘要层 - 抽象概念

这是记忆金字塔的顶端,也是最高级的认知层。它在实体关系网络的基础上,进行更深度的聚类分析和模式识别,形成高度浓缩的摘要和见解。

簇 (Clusters):系统会自动将关联紧密的实体和关系归纳成“簇”或“社群”。例如,所有与“Q3季度营销活动”相关的任务、人员、文档和讨论,会被自动聚合在一起,形成一个主题社区。

摘要 (Summaries):对于每一个“簇”,系统能生成一个高层次的摘要。智能体只需读取这个摘要,就能迅速了解这个复杂主题的核心内容,而无需重新阅读所有底层细节。

作用:这一层赋予了智能体宏观洞察和快速理解复杂问题的能力。当用户问及一个跨越长时间、涉及多方的复杂项目时,智能体可以直接调用Level 3的摘要,迅速把握全局,并给出有洞见的回答。这好比我们人类能够对一段长期的经历(如“我的大学生活”)形成一个高度概括的印象。

— 3 为什么类人记忆系统架构如此重要?— 

AI智能体从“有用的工具”向“可靠的伙伴”转变

Memory in LLM agents

这种分层记忆架构不仅仅是一个技术概念,它为构建下一代AI智能体带来了四大核心优势:

1.  深度上下文感知:智能体能够记住长期的对话历史和用户偏好,让交流像和老朋友聊天一样自然流畅。

2.  高度个性化:通过不断学习和构建关于用户的“实体-关系-社群”模型,智能体可以提供真正量身定制的服务和建议。

3.  强大的推理能力:面对需要整合多方面信息才能回答的复杂问题,智能体可以通过其结构化的记忆网络进行推理,找到答案。

4.  较高的检索效率:从原始数据到抽象摘要的逐级提炼,使得信息检索过程从“大海捞针”变成了“按图索骥”,响应速度和资源消耗都得到了巨大优化。

结论

我们正处在AI智能体从“有用的工具”向“可靠的伙伴”转变的关键节点。而一个强大、持久、且能够不断演进的记忆系统,正是实现这一飞跃的核心。图中所展示的这种类人记忆架构,通过模仿人类从具体情节到抽象概念的认知过程,为我们提供了一个值得探索的思路。

读者福利大放送:如果你对大模型感兴趣,想更加深入的学习大模型,那么这份精心整理的大模型学习资料,绝对能帮你少走弯路、快速入门

如果你是零基础小白,别担心——大模型入门真的没那么难,你完全可以学得会

👉 不用你懂任何算法和数学知识,公式推导、复杂原理这些都不用操心; 👉 也不挑电脑配置,普通家用电脑完全能 hold 住,不用额外花钱升级设备; 👉 更不用你提前学 Python 之类的编程语言,零基础照样能上手。

你要做的特别简单:跟着我的讲解走,照着教程里的步骤一步步操作就行。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

现在这份资料免费分享给大家,有需要的小伙伴,直接VX扫描下方二维码就能领取啦😝↓↓↓ 在这里插入图片描述

为什么要学习大模型?

数据显示,2023 年我国大模型相关人才缺口已突破百万,这一数字直接暴露了人才培养体系的严重滞后与供给不足。而随着人工智能技术的飞速迭代,产业对专业人才的需求将呈爆发式增长,据预测,到 2025 年这一缺口将急剧扩大至 400 万!! 在这里插入图片描述

大模型学习路线汇总

整体的学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战,跟着学习路线一步步打卡,小白也能轻松学会! 在这里插入图片描述

大模型实战项目&配套源码

光学理论可不够,这套学习资料还包含了丰富的实战案例,让你在实战中检验成果巩固所学知识 在这里插入图片描述

大模型学习必看书籍PDF

我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。 在这里插入图片描述

大模型超全面试题汇总

在面试过程中可能遇到的问题,我都给大家汇总好了,能让你们在面试中游刃有余 在这里插入图片描述

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。 在这里插入图片描述 👉获取方式

😝有需要的小伙伴,可以保存图片到VX扫描下方二维码免费领取【保证100%免费】 在这里插入图片描述 相信我,这套大模型系统教程将会是全网最齐全 最适合零基础的!!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐