LLM - 六大核心组件构建智能 Agent 的上下文系统（Context Engineering）

上下文工程：大语言模型落地的关键桥梁在大语言模型（LLM）应用中，上下文工程通过六大核心组件（Agent决策、查询增强、检索系统、提示工程、记忆系统、工具集成）解决模型与现实的连接瓶颈。其核心是动态编排信息流，整合外部数据与工具，实现智能系统的可靠决策与多轮交互。相比传统提示工程，上下文工程更注重架构设计，支持复杂任务场景。开发者需关注信息流转质量、分块优化和混合记忆策略，避免过度依赖模型本身能

小小工匠

312人浏览 · 2025-11-21 18:00:00

小小工匠 · 2025-11-21 18:00:00 发布

在这里插入图片描述

引言

在大语言模型（LLM）广泛应用的AI时代，为什么我们还会遇到“模型不会回答我的私有文档”、“不知道昨天发生了什么”、“答不准还喜欢胡编乱造”等问题？这些并非模型本身的智能瓶颈，而是上下文设计与工程缺失的结果。如何让LLM在现实世界中真正落地，智能Agent如何可靠决策，这正是上下文工程急需解决的核心挑战。

一、上下文工程：定义与重要性

1.1 上下文工程是什么？

上下文工程是一门架构与设计学科，其本质是在正确的时间为大语言模型提供正确的信息，连接模型与外部世界，实现智能Agent的“知行合一”。它并不是单纯修改模型本身，而是针对模型与现实世界的连接瓶颈构建“桥梁”，负责信息编排、知识管理、工具联动等。

1.2 为什么需要上下文工程？

LLM的弱点：
- 受限于“上下文窗口”，模型每次只能纳入有限的信息，旧信息随时被刷新，关键细节可能遗失。
- 无法主动访问用户私有数据、实时事件、外部知识库。
- 仅靠提示工程难以根治上下文容量与连贯性的问题。
典型痛点：
1. LLM答不出特定/隐私/时效性问题
2. 被过期信息、虚假内容“污染”
3. 难以支持复杂多轮交互与任务流
解决之道：必须围绕LLM建立高效的信息流与外部系统整合机制，让“Agent”会决策、能记忆、善用工具，打造从“模型技术”向“智能系统工程”的升级

二、六大核心组件全面解构

2.1 Agents（决策大脑）

概念与作用

Agent是围绕LLM构建的智能决策系统，负责动态编排信息流、跨步骤维护历史状态、智能调用外部工具，并基于结果做自我修正。

Agent 架构类型

架构类型	特点与适用场景
单Agent	适合中等复杂度、全流程一体化任务
多Agent	各Agent分工，支持高度复杂与专业化，但需解决协调与信息同步

典型能力

动态决策信息流：判断何时用何信息
历史状态管理：多轮、跨任务跟踪进展
自适应工具使用：按需选择/组合第三方能力
基于反馈自修正：策略无效时自动切换方法

上下文核心挑战

有效筛选“应留”信息入窗口，外部哪部分应存储并检索，如何压缩/精简“背景”以节省token[1]

常见上下文错误类型

Context Poisoning：上下文混入错误/幻觉信息被沿用放大
Context Distraction：无关历史信息过多导致决策分散
Context Confusion：不相关工具/文档塞满窗口造成混乱
Context Clash：冲突信息导致Agent无法做出准确判断

Agent核心策略举例

定期上下文摘要/修剪
对检索信息做质量验证
实时自适应检索与工具选择
多信息源综合分析+冲突解决
外部记忆卸载，提升连续推理空间

2.2 Query Augmentation（查询增强）

概念

把混乱、不完整的用户请求转换为可操作的、对机器与知识检索友好的精确意图，并能据流程各环节适配修改。

典型细分

查询重写（Query Rewriting）：将原始模糊请求升级为“可检索性”强的关键字/结构化表达式
查询扩展（Query Expansion）：针对同一问题构造多个相关子查询提升召回
查询分解（Query Decomposition）：复杂复合型请求拆解成可单独处理的子问题
Query Agent：智能管道，自动控制前述过程

工程难点与建议

注意“过度扩展”与“查询漂移”
每部分的适配性调整（如：LLM友好 ≠ 检索友好）
系统需根据用户习惯自动优化，无需用户具备专业表达能力

示例

用户原问：“公司2022年财报有哪些亮点？”
→ 查询重写：“公司2022年度财务报告主要数据”
→ 查询扩展：+“2022利润分析” +“2022主营业务增长”
→ 查询分解：A. 利润表现 B. 主营业务板块变动 C. 资产负债变化

2.3 Retrieval（检索系统）

概念

让LLM与私有/行业/实时文档和知识实体连接，提升“事实感知”与“最新信息支持”能力。

实践体系：RAG（Retrieval Augmented Generation）架构核心

Chunking分块：将大文档分解为结构、语义自洽的小段，平衡“检索精度”与“上下文丰富度”
多种分块技术：
- 固定长度/递归优先分隔/层级分块/延迟分块/基于语义与LLM智能划分
预分块vs后分块：根据应用需求灵活选型

工程实操要点

分块越“小”越精确召回，但上下文会丢失；越“大”，命中率降低，但完整性提升
需测试找到“分块最佳点”

示例

固定分块：每800token一块，适合结构化数据多、业务流程明晰文档
递归与语义分块：优先按自然段/章节切分，AI判定段意完整性，适用于非结构化、长篇知识库

2.4 Prompting Techniques（提示工程）

概念

为LLM输出期望结果编写高效、明晰、针对性强的指令，是上下文工程的重要辅助环节。

基础与进阶方法

Chain of Thought (CoT)：引导模型一步步思考并显式展示推理链条
Few-Shot Prompting：附上几个高质量范例，模型按风格输出
CoT+Few-Shot：推理+例子双管齐下
Tree of Thoughts (ToT)、ReAct等高级范式，融合行动与反思
Token压缩：要求AI思考步骤极简化，句长受控，降低成本

示例

请以以下格式思考：1. 重复用户需求 2. 分析可用知识 3. 推理得出建议 4. 总结重点，每步不超10字。

2.5 Memory（记忆系统）

概念

为智能Agent建立“历史感知”与“学习能力”，解决LLM短期易遗忘、难持续跟踪用户个性和历史等结构性弱点。

记忆类型

记忆类型	作用与说明
短期记忆	当前上下文窗口内，跟踪对话与操作
长期记忆	外部存储，供RAG检索用，存知识、历史、主线
工作记忆	针对当前多步骤任务保留临时信息
程序记忆	模型自动归纳有效流程、形成渐进性“经验库”

工程策略

混合记忆体系：短长期配合，兼顾实时与深度知识积累
高效率修剪、选择性存储，只保留有效关键信息
检索能力为核心：外部向量库等需高效支持“按需召回”

示例

短期记忆：“当前对话是问文档检索，刚完成‘财报亮点’”
长期记忆：“该公司2020-2024年主要经营情况”已在向量库作为查询基准

2.6 Tools（工具集成）

概念

通过“工具化”为LLM系统赋能，使其可以像人类一样实时查阅外部数据、触发API、链式调用多系统，实现感知-思考-行动闭环。

工具调用关键

函数调用（Function/Tool Calling）：让模型输出API调用参数、结构化JSON需求而非仅凭描述
工具链：像“查航班→查酒店→定行程”多步决策自动连接
系统自动发现、筛选与使用工具
编排与反馈循环（思考-行动-观察）：Agent持续判断是否继续、是否切换工具还是结束任务

工具编排实例

用户：帮我查明天广州天气并发邮件
Agent思考：需用weather、email两个工具
→ Action：调用get_weather("广州", "明天")
→ Observation：获取天气信息
→ Action：调用send_email(user, "明天", 天气信息)
→ Observation：邮件已发送
→ 思考：任务完成

三、上下文工程 vs 传统提示工程：一表速览

项	传统提示工程	上下文工程
核心关注	提示设计	架构、系统、信息流
系统能力	静态输出、单轮任意问答	动态决策、多轮、复杂任务
信息来源	仅依靠模型“记忆”	外部知识、私有数据、实时工具等
适用场景	基础问答、内容生成	智能助理、垂直场景、自动化流程
工程难点	提示调优	信息编排、工具整合、数据治理

四、最佳实践与实例解析

场景实例1：企业知识型助手

需求：员工问“本月销售规模与历史对比，有哪些异常？”
系统流程：
1. Agent分析意图，调用检索系统查公司本月销售数据
2. 调整查询增强，兼顾历史同比数据召回
3. 检索结果chunking、摘要入窗口
4. 如信息还不足，触发更多外部API（如BI报表）
5. Agent质检合成答案，选取并压缩最有价值数据
6. 调用发送总结、任务派发等实用工具
工程技巧：多模型/多工具协同、记忆外部化、高频信息修剪与验证，防止上下文污染

场景实例2：RAG驱动的开发问答机器人

能分辨混杂的用户意图，自动拆为查API/查最佳实践/查场景案例等子问题，链式检索文档、语料，答案融合归纳，持续积累企业专有知识

五、面向开发者的落地建议

5.1 学习关键点

理解“6大核心组件”逻辑、接口与边界
工程化关注信息质量流转每个环节
定期测试上下文窗口边界、分块调优
采用“混合记忆+智能检索+高阶Prompt+工具编排”联合范式

5.2 常见误区

只堆技术栈、忽视上下文流设计
LLM全能幻想而忽略能力边界
上下文与工具接口“写死”、难支撑业务迭代

5.3 行业趋势

Agent工程、RAG方法、记忆治理将成为AI应用主流
开源生态与企业私有化场景深度结合
自动数据治理、上下文安全管控将持续强化

结论

“上下文工程”是2025年AI Agent、智能系统架构的广阔蓝海，不只是“喂好Prompt”、增加Token这么简单，而是从系统与工程角度出发，为模型打造可靠高效的“信息生命线”。未来，最具价值的AI系统，不在于模型最大、最强，而在于系统工程最优、上下文流转最科学。作为开发者，现在学习、实践上下文工程，将引领你走在智能时代最前沿！

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

数据结构与算法 - 分治算法的并行化：子问题的并行求解思路

2048 AI社区

AI编程规模化实践：从1到100的工程化之道

例如，在设计生产级线程池时，不应简单地说"帮我写个线程池"，而应提供完整的上下文：指定角色为"JDK并发包核心开发者"，背景是"电商系统，峰值QPS 5000"，任务是"设计动态线程池"，具体要求包括"支持动态调参、有监控指标输出"，并明确输出格式为"完整Java类+注释"。通过模块化设计、精确的规范、严格的审查、平台化工具和持续的价值验证，团队能够将AI这个"超级助手"的潜力在复杂工程中充分释放