最近,两篇新论文正在学术圈引发热议。

Google的ReasoningBank和斯坦福的ACE(Agentic Context Engineering),看似研究不同方向,实则都在解决同一个根本问题:如何让AI系统真正学会学习。

不是训练时的学习,而是使用时的学习。不是从数据集中学习,而是从自己的经历中学习。

重复犯错的AI

想象这样一个场景:你让AI助手帮你在购物网站上找到某个商品的首次购买日期。它先点击了"最近订单",只看到了最近的购买记录,错误地报告了最近一次的日期。下次遇到类似任务,它还是先点"最近订单",再次失败。

这就是目前大多数AI系统的现状。Google研究团队在论文中指出,即使是最先进的大语言模型agent,也会不断重复相同的错误,因为它们缺乏从过往经验中学习的能力。每次任务都是孤立的,宝贵的经验被丢弃,错误不断重演。

Google的解法:ReasoningBank

Google提出的ReasoningBank,本质上是一个AI的经验管理系统。它包含三个核心组件:

记忆提取:系统将每个执行轨迹转化为结构化的记忆项,每项包含标题(核心策略总结)、描述(一句话概述)和内容(具体的推理步骤和见解)。

双向学习:与以往只存储成功经验不同,ReasoningBank同时从失败中学习。成功的轨迹提供验证过的策略,失败的轨迹则提供反面教训和需要避免的陷阱。

智能检索:面对新任务时,系统通过嵌入向量搜索找到最相关的记忆项,将其注入到系统提示中,指导决策。

更进一步,论文提出了MaTTS(Memory-aware Test-Time Scaling)机制。通过并行生成多个轨迹或迭代优化单个轨迹,系统获得丰富的对比信号,从而合成更高质量的记忆。

实验结果令人瞩目:在WebArena网页导航任务上,配备ReasoningBank的Gemini-2.5模型成功率从40.5%提升到48.8%,平均步数从9.7减少到8.3。在SWE-Bench代码修复任务上,平均步数减少了2.8步。

斯坦福的创新:活的提示词

斯坦福的ACE走了完全不同的路线。他们认为,与其修改模型权重,不如让输入上下文本身进化。

ACE将模型分成三个专门角色:

  • 生成器(Generator):执行实际任务
  • 反思器(Reflector):分析执行轨迹,提取成功原因或失败教训
  • 策展人(Curator):将见解整合成结构化的上下文更新

关键创新在于"增量更新"机制。传统方法倾向于重写整个提示词,导致"上下文崩溃",即提示词越来越短,细节逐渐丢失。ACE则采用增量的"delta更新",每次只添加或修改相关部分,保持知识的连续性。

在AppWorld基准测试上,ACE实现了惊人的提升:任务完成率达到76.2%(基线仅63.7%),在更困难的challenge分割上提升更是达到24.5%。更重要的是,ACE将适应延迟降低了86.9%,成本降低了80%以上。

涌现的智能

两项研究都观察到了有趣的涌现行为。ReasoningBank中的记忆项会随时间演化,从简单的执行指令(“找到导航链接”)逐步发展为复杂的组合策略(“交叉验证需求并重新评估选项”)。这种演化过程类似于人类从新手到专家的成长轨迹。

ACE生成的上下文则变成了详尽的"操作手册",包含领域特定的见解、工具使用指南,甚至可直接使用的代码片段。研究发现,与人类偏好简洁不同,大语言模型在面对长而详细的上下文时表现更好——它们能够自主提取相关信息。

新的范式

结合 Google 的 ReasoningBank 来看,AI 学习正在发生从"无状态的计算工具"向"有记忆的智能体"的范式转变。这两篇论文都在绕开微调,在模型外围找解决方案,探索如何让AI系统真正具备持续学习和自我改进的能力。

ReasoningBank 让 Agent 记住具体教训,ACE 让上下文持续优化。一个是外部记忆,一个是内部流程。如果把两者结合,我们得到的将是一个既能积累经验(ReasoningBank),又能优化方法(ACE)的系统。

AI不仅需要变得更聪明,更要学会如何学习。"活的提示词"和“会学习的记忆”时代可能真的要来了。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

在这里插入图片描述

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述
在这里插入图片描述

03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述
在这里插入图片描述

04.大模型面试题目详解

在这里插入图片描述

在这里插入图片描述

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

在这里插入图片描述
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐