LLM - 上下文工程(Context Engineering):从原理到实践
摘要: 上下文工程是AI智能体开发的核心技术,通过系统管理模型可访问的信息空间(系统提示、对话历史、长期记忆等),使其从“理解”升级到“执行”。相比传统提示词工程,它更关注动态信息调度与质量优化,解决长上下文导致的记忆衰减、污染等问题。四大核心策略包括写入(存储)、选择(过滤)、压缩(精简)和隔离(分治)。业界实践如Claude Code的三层记忆架构和Manus的KV缓存优化展示了高效上下文管理
文章目录
Pre
引言
随着AI技术与大模型智能体的发展,“上下文工程”(Context Engineering)正在成为开发者圈的新热点。它不只是提示词工程的升级版,而是推动AI从“能够理解”到“能够执行”关键任务的分水岭。
接下来我们将系统梳理上下文工程的理论基础、技术策略,以及实战案例,并通过结构化内容与可视化示例,深入理解如何精通上下文工程。

一、什么是上下文工程?
一句话定义:上下文工程就是在正确的时间、用正确的方式,为大模型(如LLM)提供正确的信息。
传统提示词工程只关注“怎么写Prompt”,而上下文工程关注的是:
- 模型在生成回答前能看到、能理解、能使用的全部信息空间
常用信息渠道包括:
- 系统提示词(System Prompt)
- 用户输入(User Prompt)
- 对话历史
- 长期记忆
- 检索到的知识
- 可调用的工具
- 输出格式模板
上下文工程的定位:它堪称AI智能体的信息操作系统,决定了模型的“世界观”与“行动边界”。
类比理解:LLM是CPU,上下文窗口是RAM,上下文工程就是“调度哪部分信息能放进RAM”的调度系统。

二、为什么上下文工程至关重要?
如今大模型上下文窗口已经扩展到百万token,但依然存在“上下文腐烂”(Context Decay)问题——
- 上下文越长,模型对早期信息的记忆准确率越低。
常见四大灾难级问题:
- 上下文污染:错误信息被循环引用,智能体表现越来越偏
- 上下文干扰:噪声信息拖住模型,忽略核心知识
- 上下文混乱:无关内容影响模型判断,输出不稳定
- 上下文冲突:矛盾信息导致AI陷入犹豫
堆积上下文内容不会提升智能体能力,反而让AI变得“更糊涂”。突破点在于:动态管理上下文的质量与组织结构。
三、智能体效果对比案例
假设让AI协助安排会议:
- 没有上下文工程:只会机械回复“感谢来信!明天我有空。你想几点?”
- 有上下文工程:会综合日历、联系人重要性、历史语气等,生成“嗨,明天我全天排满,周四上午有空,我已发邀请,请确认!”
区别在于模型本身没有变,背后的上下文工程发挥了真正的作用。
四、上下文工程的四大核心策略
根据LangChain团队研究,上下文工程包括以下四大操作:

-
写入(Write)——记忆的延伸
将暂时不需但未来可能用到的信息写入外部存储- 草稿本:暂存中间结果
- 长期记忆库:保存用户偏好、历史
-
选择(Select)——精准信息过滤
从外部知识库筛选与当前任务最相关的信息- 示例样本 Few-shot
- 行为规则 Policies
- 事实知识 Knowledge base
-
压缩(Compress)——信息瘦身
通过摘要/修剪减少资源消耗- 自动摘要
- 去重、剔除冗余
-
隔离(Isolate)——多任务分治
复杂任务拆成子任务,各自独立上下文执行- 多智能体协作
- 环境与沙盒分离
五、业界最佳实践案例
1. Claude Code 三层记忆架构

- 短期记忆:当前对话
- 中期记忆:智能压缩后的项目摘要
- 长期记忆:知识库(如CLAUDE.md)
- 当上下文超阈值时自动压缩,分层结构保存关键内容,实现真正“长时记忆”。
2. Manus 智能体KV缓存优化
- 缓存稳定前缀(Prompt Prefix),令缓存token成本仅为未缓存token的十分之一
- 支持智能体长链路任务时的几乎零延迟上下文调度
六、提示词工程 vs 上下文工程

| 提示词工程 | 上下文工程 | |
|---|---|---|
| 作用 | 让AI“听懂你” | 让AI“懂你、记你、持续帮你干活” |
| 侧重点 | Prompt设计 | 信息空间调度与全局质量管理 |
| 局限性 | 静态单一输入 | 动态、多渠道、高质量信息配置 |
| 典型应用 | 单轮对话问答 | 多轮协作、复杂智能体系统 |
七、 小结
AI智能体的开发正从写提示词进化为设计上下文。掌握上下文工程,意味着能构建真正有记忆、有逻辑、能执行的智能体系统。
学习建议:
- 系统理解上下文组织、管理编码模式
- 实践LangChain等智能体框架
- 深入分析模型的“信息需求空间”,区分核心与噪声
- 结合业界主流架构(Claude Code/Manus KV缓存等)做项目实验
可视化:上下文工程信息流示意图
[系统提示词]
|
[用户输入] ——+——> [临时记忆库] ——> [压缩/筛选] ——> [LLM任务窗口]
| |
[长期记忆] [多任务分治]

更多推荐


所有评论(0)