langchain上下文管理的方式

本文系统探讨了上下文管理系统的核心方法与实践。上下文管理通过存储、检索、压缩和隔离历史信息，帮助智能体在复杂任务中保持高效推理。LangChain框架提出四类方法：写入(Offload)将信息外部存储，选择(Retrieve)动态检索相关内容，压缩(Compress)提炼关键信息，隔离(Isolate)确保子任务独立性。工程实践中需应对上下文长度限制、信息冗余等挑战，在代码执行、多智能体协作等场景

董厂长

18人浏览 · 2026-01-30 16:33:22

董厂长 · 2026-01-30 16:33:22 发布

上下文管理是实现复杂推理、工具调用和多轮交互的基础能力。本文将系统梳理上下文管理的核心方法、工程挑战、典型应用场景，并结合 LangChain 框架的设计理念，帮助理解和落地上下文管理系统。

一、什么是上下文管理系统？

上下文管理系统，顾名思义，就是在智能体运行过程中，合理组织、存储、检索和裁剪“上下文”信息的机制。

上下文：指智能体在推理、对话、工具调用等过程中需要参考的历史信息，包括消息历史、用户偏好、外部知识、工具反馈等。
管理：包括 存储、检索、压缩、隔离 等多种操作，目的是让智能体既能“记住”关键内容，又不会被无关信息干扰。

二、LangChain 的上下文管理方法论

LangChain 总结了四类上下文管理的基本方法：

写入（Offload）上下文
- 将部分上下文卸载到外部存储，减少 LLM 直接处理的信息量。
- 典型场景：将历史对话、工具调用结果等写入数据库或文件系统，仅保留“指针”在当前上下文中。
- 伪代码示例：

 写入外部存储
memory_id = db.save(context_chunk)
# 只在 prompt 中保留指针
prompt = f"Refer to memory {memory_id} for details."

选择（Retrieve）上下文
- 动态检索与当前任务最相关的信息，常用 RAG（Retrieval-Augmented Generation）技术。
- 进阶用法包括 agentic search（智能体级搜索）、GraphRAG（图谱增强检索）、多轮工具调用等。
- 伪代码示例：
```
# 基于向量检索相关文档
relevant_docs = vector_db.search(query_embedding)
# 组合进 prompt
prompt = f"Context: {relevant_docs}\nQuestion: {user_query}"
```
压缩（Compress）上下文
- 对冗余或过长的上下文进行摘要、裁剪，仅保留关键信息。
- 常见做法：对消息历史、工具反馈等进行 LLM 摘要。
- 伪代码示例：
```
# 用 LLM 摘要历史消息
summary = llm.summarize(history)
prompt = f"Summary: {summary}\nNext step?"
```
隔离（Isolate）上下文
- 将上下文分区，子任务由独立的 SubAgent 处理，避免信息污染。
- 适用于多智能体协作、复杂任务分解等场景。
- 伪代码示例：
```
# 为每个子任务分配独立上下文
for subtask in subtasks:
    subagent = Agent(context=subtask_context)
    subagent.run()
```

三、工程挑战与实践

1. 典型挑战

上下文长度受限：LLM 输入窗口有限，需合理裁剪与组织信息。
信息冗余与丢失：如何在不遗漏关键信息的前提下，去除无关内容。
多智能体协作：不同 Agent 之间如何安全、有效地共享或隔离上下文。

2. 解决方案对照

方法	说明
Offload	通过引用/指针减少上下文长度，外部存储详细内容
Retrieve	RAG 技术动态检索相关信息，提升信息相关性
Compress	LLM 摘要、裁剪冗余信息，保留关键信息
Isolate	分而治之，子任务独立上下文，避免信息污染