LLM - 六大核心组件构建智能 Agent 的上下文系统(Context Engineering)
上下文工程:大语言模型落地的关键桥梁 在大语言模型(LLM)应用中,上下文工程通过六大核心组件(Agent决策、查询增强、检索系统、提示工程、记忆系统、工具集成)解决模型与现实的连接瓶颈。其核心是动态编排信息流,整合外部数据与工具,实现智能系统的可靠决策与多轮交互。相比传统提示工程,上下文工程更注重架构设计,支持复杂任务场景。开发者需关注信息流转质量、分块优化和混合记忆策略,避免过度依赖模型本身能
文章目录

引言
在大语言模型(LLM)广泛应用的AI时代,为什么我们还会遇到“模型不会回答我的私有文档”、“不知道昨天发生了什么”、“答不准还喜欢胡编乱造”等问题?这些并非模型本身的智能瓶颈,而是上下文设计与工程缺失的结果。如何让LLM在现实世界中真正落地,智能Agent如何可靠决策,这正是上下文工程急需解决的核心挑战。
一、上下文工程:定义与重要性
1.1 上下文工程是什么?
上下文工程是一门架构与设计学科,其本质是在正确的时间为大语言模型提供正确的信息,连接模型与外部世界,实现智能Agent的“知行合一”。它并不是单纯修改模型本身,而是针对模型与现实世界的连接瓶颈构建“桥梁”,负责信息编排、知识管理、工具联动等。
1.2 为什么需要上下文工程?
-
LLM的弱点:
- 受限于“上下文窗口”,模型每次只能纳入有限的信息,旧信息随时被刷新,关键细节可能遗失。
- 无法主动访问用户私有数据、实时事件、外部知识库。
- 仅靠提示工程难以根治上下文容量与连贯性的问题。
-
典型痛点:
- LLM答不出特定/隐私/时效性问题
- 被过期信息、虚假内容“污染”
- 难以支持复杂多轮交互与任务流
-
解决之道:必须围绕LLM建立高效的信息流与外部系统整合机制,让“Agent”会决策、能记忆、善用工具,打造从“模型技术”向“智能系统工程”的升级
二、六大核心组件全面解构
2.1 Agents(决策大脑)
概念与作用
Agent是围绕LLM构建的智能决策系统,负责动态编排信息流、跨步骤维护历史状态、智能调用外部工具,并基于结果做自我修正。
Agent 架构类型
| 架构类型 | 特点与适用场景 |
|---|---|
| 单Agent | 适合中等复杂度、全流程一体化任务 |
| 多Agent | 各Agent分工,支持高度复杂与专业化,但需解决协调与信息同步 |
典型能力
- 动态决策信息流:判断何时用何信息
- 历史状态管理:多轮、跨任务跟踪进展
- 自适应工具使用:按需选择/组合第三方能力
- 基于反馈自修正:策略无效时自动切换方法
上下文核心挑战
- 有效筛选“应留”信息入窗口,外部哪部分应存储并检索,如何压缩/精简“背景”以节省token[1]
常见上下文错误类型
- Context Poisoning:上下文混入错误/幻觉信息被沿用放大
- Context Distraction:无关历史信息过多导致决策分散
- Context Confusion:不相关工具/文档塞满窗口造成混乱
- Context Clash:冲突信息导致Agent无法做出准确判断
Agent核心策略举例
- 定期上下文摘要/修剪
- 对检索信息做质量验证
- 实时自适应检索与工具选择
- 多信息源综合分析+冲突解决
- 外部记忆卸载,提升连续推理空间
2.2 Query Augmentation(查询增强)
概念
把混乱、不完整的用户请求转换为可操作的、对机器与知识检索友好的精确意图,并能据流程各环节适配修改。
典型细分
- 查询重写(Query Rewriting):将原始模糊请求升级为“可检索性”强的关键字/结构化表达式
- 查询扩展(Query Expansion):针对同一问题构造多个相关子查询提升召回
- 查询分解(Query Decomposition):复杂复合型请求拆解成可单独处理的子问题
- Query Agent:智能管道,自动控制前述过程
工程难点与建议
- 注意“过度扩展”与“查询漂移”
- 每部分的适配性调整(如:LLM友好 ≠ 检索友好)
- 系统需根据用户习惯自动优化,无需用户具备专业表达能力
示例
用户原问:“公司2022年财报有哪些亮点?”
→ 查询重写:“公司2022年度财务报告主要数据”
→ 查询扩展:+“2022利润分析” +“2022主营业务增长”
→ 查询分解:A. 利润表现 B. 主营业务板块变动 C. 资产负债变化
2.3 Retrieval(检索系统)
概念
让LLM与私有/行业/实时文档和知识实体连接,提升“事实感知”与“最新信息支持”能力。
实践体系:RAG(Retrieval Augmented Generation)架构核心
- Chunking分块:将大文档分解为结构、语义自洽的小段,平衡“检索精度”与“上下文丰富度”
- 多种分块技术:
- 固定长度/递归优先分隔/层级分块/延迟分块/基于语义与LLM智能划分
- 预分块vs后分块:根据应用需求灵活选型
工程实操要点
- 分块越“小”越精确召回,但上下文会丢失;越“大”,命中率降低,但完整性提升
- 需测试找到“分块最佳点”
示例
- 固定分块:每800token一块,适合结构化数据多、业务流程明晰文档
- 递归与语义分块:优先按自然段/章节切分,AI判定段意完整性,适用于非结构化、长篇知识库
2.4 Prompting Techniques(提示工程)
概念
为LLM输出期望结果编写高效、明晰、针对性强的指令,是上下文工程的重要辅助环节。
基础与进阶方法
- Chain of Thought (CoT):引导模型一步步思考并显式展示推理链条
- Few-Shot Prompting:附上几个高质量范例,模型按风格输出
- CoT+Few-Shot:推理+例子双管齐下
- Tree of Thoughts (ToT)、ReAct等高级范式,融合行动与反思
- Token压缩:要求AI思考步骤极简化,句长受控,降低成本
示例
请以以下格式思考:1. 重复用户需求 2. 分析可用知识 3. 推理得出建议 4. 总结重点,每步不超10字。
2.5 Memory(记忆系统)
概念
为智能Agent建立“历史感知”与“学习能力”,解决LLM短期易遗忘、难持续跟踪用户个性和历史等结构性弱点。
记忆类型
| 记忆类型 | 作用与说明 |
|---|---|
| 短期记忆 | 当前上下文窗口内,跟踪对话与操作 |
| 长期记忆 | 外部存储,供RAG检索用,存知识、历史、主线 |
| 工作记忆 | 针对当前多步骤任务保留临时信息 |
| 程序记忆 | 模型自动归纳有效流程、形成渐进性“经验库” |
工程策略
- 混合记忆体系:短长期配合,兼顾实时与深度知识积累
- 高效率修剪、选择性存储,只保留有效关键信息
- 检索能力为核心:外部向量库等需高效支持“按需召回”
示例
- 短期记忆:“当前对话是问文档检索,刚完成‘财报亮点’”
- 长期记忆:“该公司2020-2024年主要经营情况”已在向量库作为查询基准
2.6 Tools(工具集成)
概念
通过“工具化”为LLM系统赋能,使其可以像人类一样实时查阅外部数据、触发API、链式调用多系统,实现感知-思考-行动闭环。
工具调用关键
- 函数调用(Function/Tool Calling):让模型输出API调用参数、结构化JSON需求而非仅凭描述
- 工具链:像“查航班→查酒店→定行程”多步决策自动连接
- 系统自动发现、筛选与使用工具
- 编排与反馈循环(思考-行动-观察):Agent持续判断是否继续、是否切换工具还是结束任务
工具编排实例
用户:帮我查明天广州天气并发邮件
Agent思考:需用weather、email两个工具
→ Action:调用get_weather("广州", "明天")
→ Observation:获取天气信息
→ Action:调用send_email(user, "明天", 天气信息)
→ Observation:邮件已发送
→ 思考:任务完成
三、上下文工程 vs 传统提示工程:一表速览
| 项 | 传统提示工程 | 上下文工程 |
|---|---|---|
| 核心关注 | 提示设计 | 架构、系统、信息流 |
| 系统能力 | 静态输出、单轮任意问答 | 动态决策、多轮、复杂任务 |
| 信息来源 | 仅依靠模型“记忆” | 外部知识、私有数据、实时工具等 |
| 适用场景 | 基础问答、内容生成 | 智能助理、垂直场景、自动化流程 |
| 工程难点 | 提示调优 | 信息编排、工具整合、数据治理 |
四、最佳实践与实例解析
场景实例1:企业知识型助手
- 需求:员工问“本月销售规模与历史对比,有哪些异常?”
- 系统流程:
- Agent分析意图,调用检索系统查公司本月销售数据
- 调整查询增强,兼顾历史同比数据召回
- 检索结果chunking、摘要入窗口
- 如信息还不足,触发更多外部API(如BI报表)
- Agent质检合成答案,选取并压缩最有价值数据
- 调用发送总结、任务派发等实用工具
- 工程技巧:多模型/多工具协同、记忆外部化、高频信息修剪与验证,防止上下文污染
场景实例2:RAG驱动的开发问答机器人
- 能分辨混杂的用户意图,自动拆为查API/查最佳实践/查场景案例等子问题,链式检索文档、语料,答案融合归纳,持续积累企业专有知识
五、面向开发者的落地建议
5.1 学习关键点
- 理解“6大核心组件”逻辑、接口与边界
- 工程化关注信息质量流转每个环节
- 定期测试上下文窗口边界、分块调优
- 采用“混合记忆+智能检索+高阶Prompt+工具编排”联合范式
5.2 常见误区
- 只堆技术栈、忽视上下文流设计
- LLM全能幻想而忽略能力边界
- 上下文与工具接口“写死”、难支撑业务迭代
5.3 行业趋势
- Agent工程、RAG方法、记忆治理将成为AI应用主流
- 开源生态与企业私有化场景深度结合
- 自动数据治理、上下文安全管控将持续强化
结论
“上下文工程”是2025年AI Agent、智能系统架构的广阔蓝海,不只是“喂好Prompt”、增加Token这么简单,而是从系统与工程角度出发,为模型打造可靠高效的“信息生命线”。未来,最具价值的AI系统,不在于模型最大、最强,而在于系统工程最优、上下文流转最科学。作为开发者,现在学习、实践上下文工程,将引领你走在智能时代最前沿!

更多推荐


所有评论(0)