Agent_如何压缩上下文：来看看Cursor、Claude

Agent 任务执行的越久，上下文越容易失控：这是由于它的运行模式决定了的：**选动作 → 调工具 → 得结果 → 追加到上下文 → 下一轮决策**

大靠山

662人浏览 · 2026-02-28 20:54:18

大靠山 · 2026-02-28 20:54:18 发布

Agent 任务执行的越久，上下文越容易失控：这是由于它的运行模式决定了的：

选动作 → 调工具 → 得结果 → 追加到上下文 → 下一轮决策

在复杂任务里，输出常常很短（函数调用、结构化参数），输入却持续增长。输入/输出 token 比例可能接近 100:1。这类场景，拼“更大窗口”很快遇到边界：成本、延迟、效果衰减都会同时出现。

所以，一个正真能长期稳定干活的 Agent，需要遵循一个原则：

按需使用：只把当前决策需要的信息放进上下文。

看起来简单，落地难在两点：

识别“此刻最值钱的信息”；
把信息以可控方式加载/卸载。

下面，我会介绍做好这两点的要诀已经可落地的方法。

一、按需使用的关键：信息价值评估

按需使用首先是“价值判断”：

哪些是目标与约束（必须常驻）
哪些是当前步骤的依据（阶段性加载）
哪些是过程噪声（应外置）
哪些可能未来会用（保留可恢复入口）

这里有一个实用标准：保留可复用的结论与索引，把大体量原始材料移出上下文。最常见的是通过文件的方式保存下来

二、动态加载与卸载：把“上下文”变成“可调度资源”

成熟做法通常会把信息分为两层：

1. 短上下文：用于决策的高密度片段

包括目标、当前状态、下一步候选动作、必要的少量证据。

2. 外部记忆：用于存放大体量材料

文件、路径、URL、日志、工具输出、历史记录都在这里。

当模型需要细节时，再读取、grep、tail、局部截取。

这类设计的优势在于可恢复：信息暂时不在上下文里，但随时能再取回来，避免不可逆压缩带来的风险。

三、上下文压缩调度方案

我将 Cursor、Claude Code、Manus 等厂商在上下文压缩上的实践做了一个梳理，大概有以下几点

1. 把长内容输出写成文件进行外置，按需读取

Cursor 的实践非常直接：shell 输出、MCP 调用结果、终端会话都同步到文件系统。

收益是上下文保持轻量，且不丢信息。

1.1 摘要阶段保留 “可回查” 的历史入口

摘要能释放上下文窗口，但属于有损压缩。

Cursor 的改进点是把对话历史作为文件提供给 Agent：摘要后如果缺细节，模型可以搜索历史文件把关键事实找回来。

这让摘要从一次性覆盖变成可回滚查询。

1.2 Skills 文件化：把复杂流程从对话里抽离

Skill 是一个非常好的抽象，它表示一个完整的技能模块，用文件描述怎么做某类任务并提供了必要的工具。

系统提示只放技能名称与简介；执行时再按需检索加载相关 Skill 内容。

这类沉淀带来的压缩效果很明显：上下文少了长篇流程复述，更多变成能力调用 + 结构化结果。

1.3 MCP 工具的按需加载：用文件索引替代全量注入

MCP 服务器经常包含大量工具与长描述，静态注入会显著膨胀上下文。

Cursor 的策略是把工具描述同步到文件夹：上下文仅保留工具名等轻量信息，需要时再查文件加载细节。

在 Cursor 报告这能将总 token 消耗降低 46.9%（多服务器场景更明显）。

1.4 长任务稳定性：用“plan.md”维持目标权重

常见做法是生成 todo.md｜plan.md ，本质是把全局计划持续更新到上下文末尾，让模型在长链路中保持目标对齐。

工程上等价于把目标状态做成可迭代的外部对象，并在关键节点回灌。

这让我们在上下文爆炸导致生成效果降低时，也可以选择带着这个 plan.md 新开一个会话，新会话重构上下文的工程也算是一种压缩

2.上下文隔离：subagent、multi agent

目前主流的 AI Coding 平台都支持 subagent 的模式，这种模式的好处在于不同的 Agent 有着天然隔离的上下文，中间产物只会留在执行任务的当前 Agent。

编排者 Agent也只需要获取到每个 subagent的任务的结果（大概率是一个文件索引），这保证了每个 Agent 的上下文都是可控的。

总结

上下文压缩的难点不在"更短"，在"更准"。

能做到按需使用的 Agent，通常具备两种能力：

对信息价值的判断
对外部记忆的调度。

总的来说就一句话：动态维护上下文，确保核心上下文只包含必要调度信息**。**

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～