读懂LLM智能体记忆，10种主流方案全解析，从底层逻辑到落地优劣一次讲透

通过大模型生成对话摘要，提取关键词、标签、核心信息，只存储精炼后的内容，过滤冗余原始文本，A-MEM、Mem0都采用这种方案，优势是记忆精简、检索效率高，缺陷是依赖提示词工程，处理不好会丢失核心语义。第三种是。

小程故事多_80

283人浏览 · 2026-05-10 09:44:10

小程故事多_80 · 2026-05-10 09:44:10 发布

在这里插入图片描述

当下大语言模型的能力边界，早已不止于单轮问答、文案生成这类浅层次任务，面向多轮交互、跨会话持续任务、复杂自主决策的LLM智能体（Agent），已经成为大模型落地的核心方向。而决定一个智能体是“用完即忘的对话工具”，还是“能持续学习、长期记忆、自主迭代的自主智能体”的核心，就是Agent记忆系统。

很多人用过智能体产品都会有直观感受，聊过的内容转头就忘，跨会话就完全重置，复杂任务做着做着就偏离初衷，本质都是记忆系统失效。市面上主流的10种Agent记忆方案，看似原理五花八门、架构各不相同，底层都是围绕“解决LLM原生上下文有限、对抗遗忘、实现知识持续累积”这一个核心问题展开。

这篇文章就抛开晦涩的论文公式，用通俗易懂的语言，把智能体记忆的底层逻辑、10种主流方案的核心原理、优劣差异、统一设计框架、落地性能权衡，从头到尾讲透，不管是技术学习者、产品设计者，还是想理解智能体底层能力的普通读者，都能完全读懂。

一、先搞懂核心：我们到底为什么需要Agent记忆？

在讲具体方案之前，必须先把三个最容易混淆的概念掰扯清楚，不然整个记忆体系的逻辑都立不住。

第一个问题，LLM本身不是有“记忆”吗，为什么还要单独做Agent记忆？
这里的核心区别，是静态预训练知识和动态运行时记忆的天差地别。

我们常说的LLM记忆，是模型预训练阶段灌入的海量静态知识，存在模型的权重参数里，它不会随着你的使用改变，你今天和它说的秘密、交代的任务、明确的偏好，它不会存进模型权重里，单轮对话结束就彻底消失。这就像人天生具备的常识和学识，不是后天经历形成的个人记忆。

而Agent记忆，是智能体在运行、交互、执行任务的全过程中，实时产生、存储、更新、调用的动态信息，是专属于这个智能体和用户的“个人经历”。它要记住用户的长期偏好、多轮对话的上下文逻辑、跨会话的任务进度、之前踩过的坑、总结的经验，实现持续进化，而不是每次交互都从零开始。

第二个关键误区，很多人把Agent记忆和RAG混为一谈，这是完全错误的。
RAG的核心，是调用外部静态知识库、文档、数据库里的公共知识，解决模型幻觉、知识滞后的问题，它聚焦的是外部静态信息，和用户的交互过程、任务状态无关。
而Agent记忆聚焦的，是交互全流程的动态信息，是会话内、跨会话的用户状态、任务进度、交互历史、决策经验、个人画像，是智能体“自己的经历”，而不是网上现成的公共知识。

最根本的痛点，还是LLM无法突破的原生限制：上下文窗口长度有上限。
不管是长对话、多轮复杂任务，还是跨天、跨周的持续任务，只要交互内容超出上下文窗口，早期的信息就会被彻底挤出，出现严重的遗忘问题。比如你让智能体帮你做一个30步的项目规划，做到第20步，它就忘了第1步的核心需求；你今天和它交代的个人偏好，明天再对话它就完全不记得。

Agent记忆的存在，就是给LLM装上“长期大脑”，突破上下文窗口的物理限制，实现信息的长期留存、动态管理、精准调用，让智能体具备人类一样的记忆能力，能累积经验、迭代推理、持续进化，支撑起复杂的长周期自主任务，而不是只能做短平快的单轮问答。

二、智能体记忆的标准工作流程：所有方案都绕不开这四步

市面上所有的Agent记忆方案，不管架构多复杂、叫法多新颖，底层的工作逻辑完全统一，都遵循一套标准化的闭环流程，只是每个环节的实现方式不同。

简单来说，一套完整的Agent记忆系统，会按这个顺序稳定运行：
首先是信息提取，用户输入的对话、指令、任务信息，先经过处理，提取出有价值、可存储的记忆内容，过滤无效冗余信息；
然后是记忆管理，模拟人类记忆的生命周期，给记忆做关联、整合、层级转换、更新迭代、无效过滤，决定哪些内容该留、哪些该删、哪些该升级为长期记忆；
接下来是记忆存储，把处理好的记忆，用合适的结构和载体存起来，保证后续能快速找到、方便更新；
最后是信息检索，当智能体需要处理当前任务时，从记忆库里精准召回相关的历史信息，注入当前的提示词，补充上下文，完成决策和回复。

这四个环节环环相扣，构成了记忆系统的完整闭环。市面上10种主流的记忆方案，本质就是在这四个环节上，做了不同的设计取舍，有的侧重存储结构创新，有的侧重自主管理能力，有的侧重检索效率，最终形成了完全不同的性能和落地效果。

三、10种主流Agent记忆方案，核心原理与优劣全拆解

下面我们就把当前行业最主流、学术圈最具代表性的10种记忆方案，逐个拆解核心逻辑、创新点、适用场景和固有缺陷，不用晦涩术语，直白讲清每个方案到底“解决了什么问题、用了什么办法、有什么优缺点”。

1. A-MEM：基于卡片盒思想的关联式记忆系统

A-MEM是针对传统记忆系统的痛点设计的，早期的记忆方案，都需要提前设定固定的记忆访问规则，场景适配性极差，换一个任务就完全失效。A-MEM的核心创新，就是放弃固定流程，支持动态记忆操作，大幅提升智能体的场景适配能力。

它的核心运行逻辑分为三步，完全借鉴了经典的卡片盒笔记法：
第一步是标准化笔记构建，每一条新的交互信息进来，都会自动生成结构化的多维笔记，带上上下文描述、关键词、分类标签，把零散的对话，变成标准化、可管理的单条记忆，解决原始信息杂乱无章的问题。
第二步是跨记忆关联链接，这是它最核心的亮点。新记忆生成后，会先检索历史记忆中语义最相关的内容，再通过大模型判断，建立两条记忆之间的关联链接。和传统分类只能把一条内容归到一个文件夹不同，A-MEM支持单条记忆归属多个关联分类，打破了单一归类的限制，把零散的记忆，织成了互通互联的知识网络。
第三步是联动式记忆检索，检索的时候，不光能命中语义匹配的单条记忆，还会自动联动调出这条记忆所有关联链接的内容，相当于你想起一件事，就能顺带想起所有相关的经历，理解更完整，不会出现信息碎片化的问题。

它的优势是记忆关联能力极强，多轮对话的上下文连贯性极好，适合长周期、强逻辑关联的任务；缺陷是记忆关联的判断完全依赖大模型，提示词工程不到位的话，很容易建立无效关联，导致检索冗余，token消耗偏高。

2. Zep (Graphiti)：时序感知的知识图谱记忆方案

Zep是GraphRAG思路在Agent记忆领域的落地，核心是用时间感知的动态知识图谱，管理所有记忆信息，解决普通记忆方案无法保留事件时序、实体关系演化的问题。

它的知识图谱分为三层子图，三层结构层层递进，完整保留记忆的全量信息：
最底层是情节子图，存储原始的对话、交互数据，每个节点对应一条原始信息，同时连接这条信息里提到的所有实体，保留最原始的交互细节；
中间层是语义实体子图，基于原始情节提取，节点是人物、事件、物品、任务目标这类实体，边是实体之间的关系，把非结构化的对话，变成结构化的关系网络；
最上层是社区子图，把关联紧密的实体集群打包，生成对应摘要，相当于把碎片化的实体关系，整合成一个个完整的事件模块，方便快速检索和理解。

它的核心优势，是自带时序感知能力，能完整保留记忆的时间顺序、关系演化轨迹，同时融合非结构化对话和结构化业务数据，多跳推理能力极强，适合需要梳理复杂关系、追溯事件时序的任务；缺陷也很明显，随着交互次数增加，图谱的复杂度会指数级上升，后续的去重、一致性维护成本极高，检索速度会大幅下降，同时纯三元组的结构化提取，会丢失部分原始语义信息。

3. MemoryBank：带遗忘机制的轻量化终身记忆方案

MemoryBank是最早落地到消费级AI助手的记忆方案之一，逻辑最简单、最轻量化，核心是模拟人类的遗忘规律，实现记忆的自适应留存和淘汰。

它的架构非常直白，核心就三个模块：记忆存储模块，负责保存过往对话、事件摘要、用户画像；记忆更新模块，基于遗忘规则动态调整记忆的权重；记忆检索模块，负责召回当前任务需要的历史信息。

它最核心的创新，是基于艾宾浩斯遗忘曲线的记忆衰减机制。记忆存入之后，不会一直原封不动，而是会随着时间流逝，自动降低记忆强度；同时，被频繁调用、和用户强相关的重要记忆，会强化权重，对抗衰减。简单来说，就是不重要的、很久不用的记忆会慢慢被遗忘，重要的、常用的记忆会一直留存，完美模拟人类的记忆规律。

同时它在模型架构上做了轻量化创新，在Transformer的每一层，都插入了可读写更新的记忆Tokens，固定模型参数不变，只通过更新记忆Tokens实现终身学习，不用微调模型，就能让智能体持续记住新信息，对抗灾难性遗忘。

它的优势是架构极简、极易落地、运行成本极低，适合轻量化的个人助手、日常对话场景；缺陷是记忆没有关联能力，都是独立存储的，多跳推理能力极差，复杂长程任务的表现拉胯，记忆管理完全靠预设规则，没有自主优化能力。

4. MemoChat：面向开放域对话的迭代式记忆方案

MemoChat是专门为长程开放域多轮对话设计的记忆方案，核心解决的是开放域聊天越聊越偏、前后矛盾、人设崩塌的问题。

它的架构分为两条并行的链路，一条是用户和机器人的正常对话流，另一条是机器人内部独立的备忘录思考系统。核心运行逻辑，是迭代式的记忆-检索-回复闭环。

每一轮对话，机器人都会先把当前对话内容，更新到内部结构化备忘录里，先维护好对话的上下文逻辑、人设设定、核心信息；生成回复之前，先从备忘录里检索相关的历史内容，保证回复和之前的所有对话保持一致，不会出现前后矛盾、忘记之前设定的问题；每一轮对话都重复这个过程，迭代更新备忘录、迭代检索相关信息，全程保障长对话的连贯性和一致性。

它的优势是对话一致性极强，人设稳定性拉满，非常适合开放域聊天、陪伴类智能体，针对对话场景做了极致优化；缺陷是场景适配性极差，只能适配对话场景，面对复杂决策、任务执行类的智能体，完全无法支撑，记忆没有分层管理，长周期任务的信息筛选能力很弱。

5. MemGPT：大模型自主管控的虚拟上下文方案

MemGPT是彻底改变记忆管理逻辑的颠覆性方案，也是目前行业影响力极大的记忆架构，它直接把计算机操作系统的逻辑，搬进了LLM记忆管理，彻底解决了上下文窗口有限的核心痛点。

之前的所有记忆方案，都是“外部程序管理记忆，LLM只负责调用”，存什么、取什么，都是提前写好的规则决定的，LLM本身没有话语权。而MemGPT的核心思想，是把LLM当成计算机的CPU，原生上下文窗口当成物理内存，外部数据库当成虚拟硬盘，让LLM自己当管理员，自主管理自己的记忆。

它的核心运行逻辑分为三点：
第一，构建虚拟无限上下文。LLM原生的上下文窗口很小，就像电脑的物理内存，只能放当前运行的核心程序；MemGPT在外部向量库、数据库里，搭建了一个无限大的虚拟上下文，当前对话只保留最核心的关键信息，所有历史内容，都选择性持久化到外部虚拟存储里，彻底突破上下文窗口的长度限制。
第二，系统级的换页调度逻辑。就像电脑内存不足时，会把不常用的数据挪到硬盘，需要的时候再调回来，MemGPT会实时监控上下文状态，一旦检测到上下文空间不足，就自动把近期的对话、中间状态，压缩成记忆块写入外部存储；当LLM需要不在当前上下文的信息时，自动通过检索工具，把对应的记忆调回当前上下文。
第三，也是最核心的，LLM完全自主管控记忆。不是外部规则决定存什么、删什么、取什么，而是LLM自己通过函数调用，自主决定哪些内容值得长期存储、当前任务需要调取哪些记忆、哪些无效记忆可以删除，完全实现了记忆的自主管理，而不是被动接收规则。

它的优势是突破上下文限制的能力极强，自主决策能力拉满，适配几乎所有类型的智能体，是目前通用性极强的架构；缺陷是完全依赖LLM的函数调用能力和指令遵循能力，小模型很容易出现记忆调度混乱，同时全程的函数调用、检索操作，token消耗极高，运行成本远高于轻量化方案。

6. MemoryOS：三层分级的类人脑记忆架构

MemoryOS是完全模拟人类大脑记忆逻辑设计的方案，核心是短期、中期、长期三层存储架构，通过预设的记忆迁移策略，模拟人类记忆从短期临时记忆，转化为长期深度记忆的全过程，逻辑最符合人类直觉。

它的三层架构分工极其明确，完全对应人脑的记忆逻辑：
短期记忆，是固定长度的先进先出队列，只存储最近几轮的对话内容，聚焦当下的即时上下文，用完就按顺序淘汰，负责当下的对话连贯；
中期记忆，把短期记忆里的对话内容，按主题、语义相似度聚合成主题片段，相当于近期重要话题的缓存，不会轻易淘汰，负责保留近期的核心任务、关键对话；
长期记忆，存储稳定不变的用户画像、个人偏好、固定知识库、核心经验，跨会话永久留存，负责保障跨会话的个性化一致性，不会随着对话结束重置。

三层之间有严格的迁移和淘汰策略：短期记忆队列满了，就把最旧的内容，合并到对应主题的中期记忆里；中期记忆里的内容，会按访问频率、内容重要性、时间衰减计算热度评分，评分超过阈值，就升级为长期记忆永久留存，评分过低的低热度内容，直接淘汰清理。

它的优势是记忆分层逻辑清晰，记忆生命周期管理极完善，长周期任务的稳定性极好，个性化能力拉满，同时粗粒度的片段存储，有效控制了token成本；缺陷是记忆迁移、热度评分都是预设规则，无法动态适配场景变化，记忆之间的关联能力较弱，复杂推理场景有局限。

7. MemOS：统一抽象的记忆操作系统方案

很多人会把MemOS和上面的MemoryOS搞混，这两个是完全不同的方案。MemoryOS是聚焦记忆分层存储的系统，而MemOS是把所有记忆都当成系统资源，搭建完整操作系统级抽象层的终极方案，是目前记忆管理逻辑最完整、最复杂的架构。

之前的所有方案，都有一个致命问题：记忆的形态不统一。有的存在模型隐藏状态里，有的存在外部文本里，有的存在向量库里，不同形态的记忆，无法统一管理、调度、迁移。而MemOS的核心创新，是提出了MemCube统一记忆抽象单元。

它把智能体所有形态的信息，全部封装成统一的MemCube记忆对象：包括模型权重里的参数化知识、运行时上下文的激活状态记忆、外部数据库里的显式文本记忆，不管是什么形态、什么来源，全部统一格式，标注来源、重要性、使用历史、生命周期，实现了全类型记忆的统一可管理、可迁移、可溯源、可调度。

在此基础上，MemOS完全把记忆当成计算机的CPU、内存、硬盘这类系统资源，搭建了完整的资源调度系统，实现记忆的标准化表示、结构化组织、动态调度、全生命周期演化。智能体运行任务时，系统会动态决定，当前任务需要加载哪些记忆、淘汰哪些无效记忆、不同形态的记忆之间怎么迁移，下一个token的生成，不光看当前提示词，更看当前可调用的记忆视图和调度策略。

简单来说，MemOS是给智能体做了一套完整的记忆底层系统，而不只是一个记忆存储工具。它的优势是通用性拉满，适配所有场景、所有类型的智能体，记忆管理能力是目前所有方案里最完善的，支持复杂的自主决策和终身学习；缺陷是架构极其复杂，落地难度极大，调度逻辑繁琐，token消耗极高，小模型根本无法承载，只有大参数量模型才能发挥效果。

8. Mem0：轻量化动态个性化记忆方案

Mem0是目前落地性极强、轻量化程度极高的主流方案，核心是动态精准的个性化记忆提取，兼顾了记忆能力和运行成本，同时推出了图结构的增强版本，适配不同场景。

它的核心逻辑非常务实，不搞复杂的架构，聚焦“不存冗余信息、精准调用有用信息”。首先是动态记忆抽取，从持续的对话里，精准识别用户的身份、偏好、禁忌、任务目标、核心需求，只把这些有价值的信息，结构化提取成记忆条目，原始的无效对话、冗余内容直接过滤，避免存储大量无用信息，占用存储、拖慢检索速度。

检索的时候，它没有只用单一的语义相似度，而是融合了语义匹配、实体关联、会话范围、时间衰减四个信号，精准筛选出当前任务最相关的记忆，不会召回大量无关内容。同时它的增强版Mem0ᵍ，搭建了实体关系有向图，支持多跳推理，能快速关联多条相关记忆，弥补了轻量化方案推理能力弱的缺陷。

它的优势是架构极简、极易落地、运行成本极低，记忆精准度高，没有冗余操作，兼顾了效果和成本，是目前商用落地最常用的方案之一；缺陷是基础版的记忆关联能力较弱，多跳推理能力有限，增强版的图结构，又会带来复杂度和成本的上升，在极致复杂的长程任务上，不如MemOS、MemTree这类重型方案。

9. MemTree：动态树状结构的分层记忆方案

MemTree是存储结构创新的代表方案，核心是用动态演化的层级树状结构，管理长期记忆，解决了扁平存储检索效率低、分层固定无法适配内容变化的问题，也是本次性能评估里，表现第一梯队的方案。

它把所有记忆，组织成一棵层级化的记忆树，层级从上到下，从抽象到具体：顶层节点是全局主题、核心任务目标，中间层节点是分主题、事件摘要，底层叶节点是最细粒度的原始对话、具体事件片段，每个节点都自带语义向量、聚合文本、抽象层级，结构极其清晰。

最核心的亮点，是它的结构动态自适应调整。不是树结构建好就固定不变，新的记忆进来之后，会实时计算语义相似度，自动匹配对应的节点：语义相近的就合并到现有节点，全新的内容就新建分支和节点，主题整合之后就调整层级，整棵树会随着对话和任务的推进，动态演化、自动优化，永远保持最合理的结构。

检索的时候优势更是碾压扁平存储，先通过顶层节点做粗筛，快速锁定对应的主题分支，缩小检索范围，再在底层节点做细粒度搜索，检索速度极快，同时能兼顾全局主题逻辑和局部细节信息，不会出现捡了细节丢了全局、或者记住全局忘了细节的问题。

它的优势是检索效率极高，长程记忆的完整性、连贯性拉满，多轮对话、长文档任务、复杂推理的表现，是所有方案里的第一梯队，记忆分层抽象能力极强；缺陷是树结构的动态调整，完全依赖大模型的语义判断和聚合能力，同时随着树的深度增加，新记忆插入的成本会逐步上升，token消耗偏高，落地难度高于普通扁平方案。

四、所有记忆方案的统一框架：四大核心模块拆解

看完10种方案的差异化设计，我们再把它们收拢到同一个框架里。不管方案多么花哨，所有的Agent记忆系统，都可以拆解为四大核心模块化组件，这也是我们设计、评估、选型记忆方案的核心标准。

1. 信息提取模块：记忆的入口，决定记忆质量的基础

信息提取是记忆系统的第一道关卡，决定了存进去的内容有没有价值，目前所有方案，都逃不出三种实现范式：
第一种是直接归档范式，零额外处理，直接存储原始对话、时间戳、上下文信息，不做提取、不做摘要，最大程度保留原始语义，不会丢失信息，MemoryBank、MemGPT都用这种方案，优势是信息完整，缺陷是冗余度极高。
第二种是摘要式提取范式，通过大模型生成对话摘要，提取关键词、标签、核心信息，只存储精炼后的内容，过滤冗余原始文本，A-MEM、Mem0都采用这种方案，优势是记忆精简、检索效率高，缺陷是依赖提示词工程，处理不好会丢失核心语义。
第三种是图式提取范式，从文本里提取主语-谓语-宾语三元组，构建结构化的知识图谱，只存储实体和关系，Zep、Mem0ᵍ用这种方案，优势是结构化程度高、推理能力强，缺陷是语义丢失严重，很多对话的隐含信息、情感信息，无法用三元组表达。

2. 记忆管理模块：记忆的大脑，决定智能体的记忆智商

记忆管理是整个系统的核心，模拟人类记忆的完整生命周期，所有方案的核心差异，都在这个模块，它包含五大核心操作：
一是记忆关联，给相关的记忆建立链接，避免记忆碎片化，决定了多跳推理能力的上限；
二是记忆整合，把碎片化的零散记忆，整合成完整的事件、主题、用户画像，避免信息杂乱；
三是跨层级转换，把临时的短期记忆，转化为长期留存的永久记忆，实现长期记忆累积；
四是记忆更新，动态更新过时、错误的记忆，修正之前的错误信息，保证记忆的准确性；
五是无效过滤，清理冗余、无用、过时的记忆，避免记忆库膨胀，保障检索效率。

3. 记忆存储模块：记忆的载体，决定检索效率和扩展性

存储模块是记忆的容器，核心分为两类组织方式：
一类是扁平式存储，用先进先出队列、JSON文件、普通数据库存储，结构简单、极易落地，但是记忆量大之后，检索效率极速下降；
另一类是结构化存储，分为分层存储和图存储，分层存储就是MemoryOS的三层架构，分粒度管理记忆；图存储就是Zep的知识图谱、MemTree的树状结构，结构化程度高、检索效率高、推理能力强，但是架构复杂、落地成本高。

4. 信息检索模块：记忆的出口，决定记忆能不能用对

存储了再多记忆，检索不出来、检索不准，就是完全无效的，目前主流的检索范式分为四种：
第一种是词汇检索，用BM25、杰卡德相似度做精确匹配，速度极快，但是无法解决语义失配问题，比如同义词、近义词无法匹配；
第二种是向量检索，通过语义嵌入向量，用余弦相似度做近似最近邻搜索，是目前的主流方案，解决了语义失配问题，适配绝大多数场景；
第三种是结构检索，针对图结构、树结构的记忆，做图遍历、树层级搜索，多跳推理能力极强，适配复杂关系任务；
第四种是大模型辅助检索，先通过大模型重构查询指令、识别核心实体，再做检索，大幅提升检索精准度，适配开放域复杂对话场景。

五、落地性能终极评估：10种方案的优劣权衡与选型结论

最后我们结合行业标准的长程对话评估数据集LOCOMO、长程记忆评估数据集LONGMEMEVAL的实验结果，讲清楚这些方案的真实性能差异、成本权衡，给大家落地选型的核心结论。

第一核心结论：信息完整性，是记忆系统的底线

实验结果明确证明，保留原始对话信息的方案，性能全面优于纯三元组结构化提取的方案。也就是Mem0基础版，性能优于图结构增强版Mem0ᵍ，直接归档的方案，优于只存关系三元组的方案。

因为结构化的图谱提取，会不可避免地丢失文本的原始语义、隐含信息、情感逻辑、上下文细节，而这些内容，恰恰是长程对话、复杂任务的核心。很多人误以为结构化程度越高，记忆效果越好，实际恰恰相反，信息不丢失，是记忆有效的前提，结构化是锦上添花，不能丢了西瓜捡芝麻。

第二核心结论：记忆关联能力，决定多跳推理的上限

实验数据明确显示，没有记忆关联能力的方案，比如MemoryBank、基础版MemGPT，在多会话、长周期、复杂推理任务上，性能极差。而具备记忆关联、跨记忆链接能力的方案，比如A-MEM、Zep、Mem0，性能有指数级提升。

因为智能体的复杂决策，从来不是靠单条记忆完成的，而是需要关联多条相关的历史经历、经验、信息，没有关联能力，记忆就是一盘散沙，智能体永远只能看到碎片化的信息，无法完成完整的逻辑推理。

第三核心结论：性能与成本永远正相关，落地必须做取舍

实验结果明确显示，方案的F1得分、任务准确率，和token消耗、运行成本完全正相关。
第一梯队的MemTree、MemOS，准确率最高，长程任务效果最好，但是token消耗极大，运行成本最高，落地难度最大；
轻量化的MemoryBank、Mem0基础版，成本极低、极易落地，但是复杂任务的性能，远不如重型方案；
同时，粗粒度的记忆处理，不一定会降低性能，反而能过滤冗余信息，放大模型的泛化能力，在保证效果的同时，大幅降低成本。