LLM - 上下文工程（Context Engineering）：从原理到实践

摘要：上下文工程是AI智能体开发的核心技术，通过系统管理模型可访问的信息空间（系统提示、对话历史、长期记忆等），使其从“理解”升级到“执行”。相比传统提示词工程，它更关注动态信息调度与质量优化，解决长上下文导致的记忆衰减、污染等问题。四大核心策略包括写入（存储）、选择（过滤）、压缩（精简）和隔离（分治）。业界实践如Claude Code的三层记忆架构和Manus的KV缓存优化展示了高效上下文管理

小小工匠

1421人浏览 · 2025-11-09 07:00:00

小小工匠 · 2025-11-09 07:00:00 发布

文章目录

Pre
引言
一、什么是上下文工程？
二、为什么上下文工程至关重要？
三、智能体效果对比案例
四、上下文工程的四大核心策略
五、业界最佳实践案例
- 1. Claude Code 三层记忆架构
- 2. Manus 智能体KV缓存优化
六、提示词工程 vs 上下文工程
七、小结

Pre

LLM - AI智能体上下文工程实战教训与优化策略

引言

随着AI技术与大模型智能体的发展，“上下文工程”（Context Engineering）正在成为开发者圈的新热点。它不只是提示词工程的升级版，而是推动AI从“能够理解”到“能够执行”关键任务的分水岭。

接下来我们将系统梳理上下文工程的理论基础、技术策略，以及实战案例，并通过结构化内容与可视化示例，深入理解如何精通上下文工程。

在这里插入图片描述

一、什么是上下文工程？

一句话定义：上下文工程就是在正确的时间、用正确的方式，为大模型（如LLM）提供正确的信息。

传统提示词工程只关注“怎么写Prompt”，而上下文工程关注的是：

模型在生成回答前能看到、能理解、能使用的全部信息空间

常用信息渠道包括：

系统提示词（System Prompt）
用户输入（User Prompt）
对话历史
长期记忆
检索到的知识
可调用的工具
输出格式模板

上下文工程的定位：它堪称AI智能体的信息操作系统，决定了模型的“世界观”与“行动边界”。

类比理解：LLM是CPU，上下文窗口是RAM，上下文工程就是“调度哪部分信息能放进RAM”的调度系统。

在这里插入图片描述

二、为什么上下文工程至关重要？

如今大模型上下文窗口已经扩展到百万token，但依然存在“上下文腐烂”（Context Decay）问题——

上下文越长，模型对早期信息的记忆准确率越低。

常见四大灾难级问题：

上下文污染：错误信息被循环引用，智能体表现越来越偏
上下文干扰：噪声信息拖住模型，忽略核心知识
上下文混乱：无关内容影响模型判断，输出不稳定
上下文冲突：矛盾信息导致AI陷入犹豫

堆积上下文内容不会提升智能体能力，反而让AI变得“更糊涂”。突破点在于：动态管理上下文的质量与组织结构。

三、智能体效果对比案例

假设让AI协助安排会议：

没有上下文工程：只会机械回复“感谢来信！明天我有空。你想几点？”
有上下文工程：会综合日历、联系人重要性、历史语气等，生成“嗨，明天我全天排满，周四上午有空，我已发邀请，请确认！”

区别在于模型本身没有变，背后的上下文工程发挥了真正的作用。

四、上下文工程的四大核心策略

根据LangChain团队研究，上下文工程包括以下四大操作：

在这里插入图片描述

写入（Write）——记忆的延伸
将暂时不需但未来可能用到的信息写入外部存储
- 草稿本：暂存中间结果
- 长期记忆库：保存用户偏好、历史
选择（Select）——精准信息过滤
从外部知识库筛选与当前任务最相关的信息
- 示例样本 Few-shot
- 行为规则 Policies
- 事实知识 Knowledge base
压缩（Compress）——信息瘦身
通过摘要/修剪减少资源消耗
- 自动摘要
- 去重、剔除冗余
隔离（Isolate）——多任务分治
复杂任务拆成子任务，各自独立上下文执行
- 多智能体协作
- 环境与沙盒分离

五、业界最佳实践案例

1. Claude Code 三层记忆架构

在这里插入图片描述

短期记忆：当前对话
中期记忆：智能压缩后的项目摘要
长期记忆：知识库（如CLAUDE.md）
当上下文超阈值时自动压缩，分层结构保存关键内容，实现真正“长时记忆”。

2. Manus 智能体KV缓存优化

缓存稳定前缀（Prompt Prefix），令缓存token成本仅为未缓存token的十分之一
支持智能体长链路任务时的几乎零延迟上下文调度

六、提示词工程 vs 上下文工程

在这里插入图片描述

	提示词工程	上下文工程
作用	让AI“听懂你”	让AI“懂你、记你、持续帮你干活”
侧重点	Prompt设计	信息空间调度与全局质量管理
局限性	静态单一输入	动态、多渠道、高质量信息配置
典型应用	单轮对话问答	多轮协作、复杂智能体系统

七、小结

AI智能体的开发正从写提示词进化为设计上下文。掌握上下文工程，意味着能构建真正有记忆、有逻辑、能执行的智能体系统。

学习建议：

系统理解上下文组织、管理编码模式
实践LangChain等智能体框架
深入分析模型的“信息需求空间”，区分核心与噪声
结合业界主流架构（Claude Code/Manus KV缓存等）做项目实验

可视化：上下文工程信息流示意图

[系统提示词]
      |
[用户输入] ——+——> [临时记忆库] ——> [压缩/筛选] ——> [LLM任务窗口]
      |                  |
[长期记忆]          [多任务分治]

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

深入了解英伟达GPU的CUDA核心

2048 AI社区

从0开始搭建AI知识库，亲手让知识“活”起来

2048 AI社区

时序预测：赋予AI Agent预测未来的能力

时序预测是人工智能领域的一个重要研究方向，它使AI系统能够基于历史数据预测未来趋势。本文旨在全面介绍时序预测技术，包括其理论基础、算法实现和实际应用。我们将重点关注这些技术在AI Agent系统中的应用，探讨如何赋予智能体预测未来的能力。时序预测的基本概念和数学基础传统时序预测方法（如ARIMA）现代深度学习方法（如LSTM、Transformer）时序预测在AI Agent中的实际应用案例相关工