Agent 任务执行的越久,上下文越容易失控:这是由于它的运行模式决定了的:

选动作 → 调工具 → 得结果 → 追加到上下文 → 下一轮决策

在复杂任务里,输出常常很短(函数调用、结构化参数),输入却持续增长。输入/输出 token 比例可能接近 100:1。这类场景,拼“更大窗口”很快遇到边界:成本、延迟、效果衰减都会同时出现。

所以,一个正真能长期稳定干活的 Agent,需要遵循一个原则:

按需使用:只把当前决策需要的信息放进上下文。

看起来简单,落地难在两点:

  1. 识别“此刻最值钱的信息”;
  2. 把信息以可控方式加载/卸载。

下面,我会介绍做好这两点的要诀已经可落地的方法。


一、按需使用的关键:信息价值评估

按需使用首先是“价值判断”:

  • 哪些是目标与约束(必须常驻)
  • 哪些是当前步骤的依据(阶段性加载)
  • 哪些是过程噪声(应外置)
  • 哪些可能未来会用(保留可恢复入口)

这里有一个实用标准:保留可复用的结论与索引,把大体量原始材料移出上下文。最常见的是通过文件的方式保存下来


二、动态加载与卸载:把“上下文”变成“可调度资源”

成熟做法通常会把信息分为两层:

1. 短上下文:用于决策的高密度片段

包括目标、当前状态、下一步候选动作、必要的少量证据。

2. 外部记忆:用于存放大体量材料

文件、路径、URL、日志、工具输出、历史记录都在这里。

当模型需要细节时,再读取、grep、tail、局部截取。

这类设计的优势在于可恢复:信息暂时不在上下文里,但随时能再取回来,避免不可逆压缩带来的风险。


三、上下文压缩调度方案

我将 Cursor、Claude Code、Manus 等厂商在上下文压缩上的实践做了一个梳理,大概有以下几点

1. 把长内容输出写成文件进行外置,按需读取

Cursor 的实践非常直接:shell 输出、MCP 调用结果、终端会话都同步到文件系统。

收益是上下文保持轻量,且不丢信息。

1.1 摘要阶段保留 “可回查” 的历史入口

摘要能释放上下文窗口,但属于有损压缩。

Cursor 的改进点是把对话历史作为文件提供给 Agent:摘要后如果缺细节,模型可以搜索历史文件把关键事实找回来。

这让摘要从一次性覆盖变成可回滚查询

1.2 Skills 文件化:把复杂流程从对话里抽离

Skill 是一个非常好的抽象,它表示一个完整的技能模块,用文件描述怎么做某类任务并提供了必要的工具。

系统提示只放技能名称与简介;执行时再按需检索加载相关 Skill 内容。

这类沉淀带来的压缩效果很明显:上下文少了长篇流程复述,更多变成能力调用 + 结构化结果

1.3 MCP 工具的按需加载:用文件索引替代全量注入

MCP 服务器经常包含大量工具与长描述,静态注入会显著膨胀上下文。

Cursor 的策略是把工具描述同步到文件夹:上下文仅保留工具名等轻量信息,需要时再查文件加载细节。

在 Cursor 报告这能将总 token 消耗降低 46.9%(多服务器场景更明显)。

1.4 长任务稳定性:用“plan.md”维持目标权重

常见做法是生成 todo.md|plan.md ,本质是把全局计划持续更新到上下文末尾,让模型在长链路中保持目标对齐。

工程上等价于把目标状态做成可迭代的外部对象,并在关键节点回灌。

这让我们在上下文爆炸导致生成效果降低时,也可以选择带着这个 plan.md 新开一个会话,新会话重构上下文的工程也算是一种压缩

2.上下文隔离:subagent、multi agent

目前主流的 AI Coding 平台都支持 subagent 的模式,这种模式的好处在于不同的 Agent 有着天然隔离的上下文,中间产物只会留在执行任务的当前 Agent。

编排者 Agent也只需要获取到每个 subagent的任务的结果(大概率是一个文件索引),这保证了每个 Agent 的上下文都是可控的。


总结

上下文压缩的难点不在"更短",在"更准"。

能做到按需使用的 Agent,通常具备两种能力:

  • 对信息价值的判断
  • 对外部记忆的调度。

总的来说就一句话:动态维护上下文,确保核心上下文只包含必要调度信息**。**

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐