收藏!一文读懂上下文工程:提升LLM性能的革命性方法,从入门到实战
文章介绍了上下文工程这一提升大模型性能的关键技术,将其定义为动态结构化的信息组件集合,区别于静态的提示词工程。详细阐述了上下文工程的三大基础组件(检索与生成、处理、管理)、系统实现方法(RAG、记忆系统等)及评估框架。通过检索增强生成、思维链等技术显著提升模型性能,为解决LLMs的计算约束、可靠性问题提供了新思路,是开发高效AI应用的重要技术路径。
最近Context Engineering这个概念大火,由此有了这篇关于LLM的上下文工程的综述论文,详细说明了为什么上下文工程如此重要,有哪些基础组件,如何系统实现和进行评估,确定了总体挑战并规划了未来研究的有前景的方向。
为什么需要上下文工程
- 定义:上下文工程将上下文Context重新概念化为动态结构化的信息组件集合 ,这些组件由一组函数进行来源、过滤和格式化,最终由高级组装函数A进行编排,即 。
- 当前局限性:LLMs面临计算约束(自注意力机制随序列长度增加带来二次计算和内存开销)、可靠性问题(频繁幻觉、对输入上下文不忠实等)、传统提示工程方法主观且局限于任务特定优化,难以应对复杂场景。
- 性能增强:通过检索增强生成和叠加提示等技术实现显著性能提升,思维链技术使复杂推理成为可能;还有比如领域特定的上下文工程在专业应用中特别有价值。
- 未来潜力:通过上下文学习实现灵活适应机制,为细致的语言理解和生成能力奠定基础,无需重新训练模型,未来在chain-of-thought增强等方面有很大潜力。
和提示词工程有什么区别?
上下文工程和提示词工程最大的区别就在于提示词是一个单一的静态的文本,而上下文工程则是动态结构化的信息组件结合,提示词工程是找到最优提示词,而上下文工程是找到理想的上下文生成函数集 。从复杂性,信息内容处理方式,可扩展性等方面上下文工程都要强得多。

基础组件
下图是上下文工程的大致框架:

上下文工程建立在三个主要组件上,分别是:context Retrieval and Generation(上下文检索及生成,负责外部知识检索和动态上下文组装来获取合适的上下文信息),Context Processing(上下文处理,负责转换和优化所获取的信息)和Context Management(上下文管理负责上下文信息的高效组织和利用)。以下是论文总结的详细的组件与内容:
| 组件 | 子类别 | 关键内容 |
|---|---|---|
| 上下文检索与生成 | 提示工程与上下文生成 | 基于CLEAR框架(简洁性、逻辑性、明确性、适应性和反思性);包含零样本和少样本学习范式、Chain-of-Thought基础、认知架构集成等 |
| 外部知识检索 | 包括RAG基础、知识图谱集成和结构化检索、智能体和模块化检索系统等,如Self-RAG引入自适应检索机制 | |
| 动态上下文组装 | 涉及组装函数和编排机制、多组件集成策略、自动组装优化等,如自动提示工程解决手动优化限制 | |
| 上下文处理 | 长序列处理 | 面临 transformer 自注意力(O(n^{2}))复杂性等计算挑战;有架构创新(如SSMs、Dilated attention等)、位置插值和上下文扩展、优化技术(如GQA、FlashAttention等)、内存管理和上下文压缩等方法 |
| 上下文自我优化与适应 | 基础框架有Self-Refine、Reflexion等;涉及元学习和自主进化,如SELF教LLMs元技能;还有长Chain-of-Thought和高级推理 | |
| 多模态上下文 | 基础技术是将视觉输入转换为离散令牌等;有高级集成策略;面临模态偏差和推理缺陷等核心挑战;具备上下文学习等高级能力,应用广泛 | |
| 关系型和结构化上下文 | 由于文本输入要求和序列架构限制,LLMs处理相关数据有困难;有知识图谱嵌入和神经集成、 verbalization 和结构化数据表示、集成框架和协同方法等解决途径;在多个方面增强LLMs能力,应用广泛 | |
| 上下文管理 | 基本约束 | 面临有限上下文窗口大小、“中间迷失”现象、LLMs本质上独立处理每个交互等约束 |
| 记忆层次结构和存储架构 | 有OS启发的层次记忆系统、动态记忆组织、架构适应、系统配置等 | |
| 上下文压缩 | 有自动编码器基压缩、记忆增强方法、层次缓存系统、多智能体分布式处理等技术 | |
| 应用 | 应用于文档处理和分析、扩展推理能力、协作和多智能体系统、增强会话接口、记忆增强应用等领域 |
系统实现
-
检索增强生成(RAG)
-
模块化RAG架构:从线性检索-生成架构转向具有灵活组件交互的可重构框架,有正式表示和当代框架等。
-
智能体RAG系统:将自主AI智能体嵌入RAG管道,有实现范式、核心能力、自我反思和适应机制等。
-
图增强RAG:从面向文档的方法转向捕获实体关系等的结构化知识表示,有知识图谱作为基础表示、图神经网络增强RAG系统、多跳推理能力、著名架构等。
-
应用:涉及实时RAG系统、动态检索机制、低延迟检索方法、可扩展性解决方案等。

-
-
记忆系统
-
记忆架构:记忆将复杂语言系统与模式匹配模型区分开来,有记忆分类框架、短期记忆机制、长期记忆实现、记忆访问模式和结构等。
-
记忆增强智能体:记忆系统从无状态模式处理器转变为复杂智能体,有智能体架构集成、现实世界应用、记忆技术和集成方法等。
-
评估和挑战:记忆评估框架是智能系统多维度评估的关键部分,有评估框架和指标、当前局限性和挑战、优化策略和未来研究方向等。

-
-
工具集成推理
-
函数调用机制:通过结构化输出生成,将LLMs从生成模型转变为交互智能体,有发展历程、技术实现、训练方法和数据系统、专门基准等。
-
工具集成推理(TIR):是LLMs能力的重大进步,解决了LLMs的基本局限性,有TIR方法学的演变、实现框架和范式等。
-
智能体-环境交互:强化学习方法成为工具集成的优越替代方案,有搜索增强推理系统、多轮和可定制工具调用框架、评估和应用等。

-
-
多智能体系统
-
通信协议:智能体通信系统源于20世纪90年代初的知识共享工作,有当代协议生态系统、LLM增强通信框架等。
-
编排机制:是多智能体系统的关键协调基础设施,有当代编排策略、新兴编排范式、上下文管理和环境适应等。
-
协调策略:多智能体编排在维护复杂工作流的事务完整性方面面临重大挑战,有多智能体编排的挑战、应用和性能影响等。

-
评估
- 评估框架和方法
- 组件级评估:对各个组件进行内在评估,如提示工程组件、长上下文处理、自我上下文化机制、结构化和关系数据集成的评估。
- 系统级集成评估:通过全面的基准测试衡量下游任务的端到端性能,如RAG、记忆系统、工具集成推理系统、多智能体系统的评估。
- 基准数据集和评估范式
- 基础组件基准:如长上下文处理、结构化和关系数据集成的基准。
- 系统实现基准:如RAG、工具集成推理系统、Web智能体、多智能体系统的基准。
- 评估挑战和新兴范式
- 方法学局限性和偏差:传统评估指标不足以捕捉上下文工程系统的细微、动态行为。
- 新兴评估范式:如自我优化评估范式、多方面反馈评估、批评引导评估、编排评估框架。
- 安全性和鲁棒性评估:包括安全性导向评估、鲁棒性评估、对齐评估。
总结
作为一篇综述性论文,首先明确定义了什么是上下文工程和其重要性,非常全面的总结了目前为止,所有和上下文工程相关的理论、方法、基准测试和评估框架。对于想要开发一个AI应用时,在综合性提升效果和体验的工程化上有很高的参考价值。
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:
04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!
06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
更多推荐


所有评论(0)