【收藏必备】大模型Agent实战：如何利用文件系统解决上下文工程痛点

本文探讨了RAG在处理复杂任务时的局限性，提出让大模型Agent自主使用文件系统进行上下文管理。文件系统作为卸载机制，让Agent按需加载和持久化数据，既解决了长上下文的Token消耗问题，又保持了数据的完整逻辑结构。相比向量检索，文件系统提供确定性数据访问，更适合代码处理等场景。为Agent提供持久化工作区，可使其分步骤处理复杂任务，大幅提升效率。

健忘的派大星

574人浏览 · 2025-11-28 15:09:41

健忘的派大星 · 2025-11-28 15:09:41 发布

前言

最近 LangChain 官方博客更新了一篇题为 “How Agents Can Use Filesystems for Context Engineering” 的文章。

初看标题，可能觉得这没什么新意——程序读写文件不是天经地义吗？但仔细读完，发现它切中了大模型应用开发目前最尴尬的一个痛点：RAG在处理复杂、连续任务时的局限性。

这篇文章的核心逻辑其实很简单：与其我们绞尽脑汁地帮模型做上下文剪裁（Context Engineering），不如把文件系统的读写权限交给 Agent，让它自己决定把什么数据加载进内存（Context），把什么数据持久化到硬盘。

这里我结合最近做 Agent 开发的经验，聊聊为什么“文件系统”这个老旧的技术概念，反而是下一阶段 Agent 的核心组件。

为什么 RAG 不够用了？

现在主流的知识库方案都是 RAG：把文档切片，存向量库，搜相似度。

这种方案在做“问答机器人”时很有效。比如用户问“公司报销流程是什么”，RAG 搜出相关段落，LLM 总结回答，流程很顺。

但在做 Coding Agent 或者 数据分析 Agent 时，RAG 就显得非常笨拙。

比如，我让 Agent “重构一下 utils.py 里的日期处理函数”。

RAG 的做法：可能只会检索出 utils.py 里和“日期”相关的几行代码片段。这不够，改代码需要了解整个文件的结构，甚至还需要了解它被谁调用了。
长上下文（Long Context）的做法：把整个项目代码全塞进 Prompt。这会导致 Token 消耗巨大，而且模型在处理超长文本时，推理能力会显著下降（所谓的 Lost in the Middle）。

img

LangChain 这篇文章提出的方案是：回归文件系统。

Agent 自主管理的 Context Engineering

文章提出了一个很有意思的视角：Context Engineering 不应该由开发者硬编码，而应该由 Agent 运行时动态决定。

当 Agent 拥有了 ReadFile、WriteFile、ListDir 这些工具后，它的工作流会变成这样：

探测：Agent 先 ListDir 看看项目里有哪些文件。
按需加载：Agent 发现需要修改 utils.py，于是调用 ReadFile 读取该文件的内容。此时，只有这个文件的内容占据了 Context。
中间状态卸载：Agent 思考（Chain of Thought）后生成了新的代码。注意，它不需要把这些代码一直挂在聊天记录里，它可以调用 WriteFile 直接把新代码覆盖进去，或者写一个 temp_fix.py。
验证：Agent 运行这个文件，读取报错日志。 1.

在这个过程中，文件系统充当了一个 Offload（卸载）机制。Agent 不需要在 Prompt 里死记硬背所有的代码细节，它只需要知道“文件在哪里”，需要的时候读进来，不需要的时候存在硬盘里。

这其实就是计算机体系结构中 Memory Hierarchy（存储层次结构） 在 LLM 领域的映射：

Context Window = 寄存器/L1缓存（极快，极贵，容量极小）
File System = 主存/硬盘（容量大，持久化，需要显式读取）

向量库 vs 文件系统：由于颗粒度不同导致的适用性差异

文章里对比了 Vector Store 和 Filesystem，我觉得最本质的区别在于数据的颗粒度和确定性。

向量检索是模糊的（Semantic Search）。它返回的是概率上最相关的碎片。这对于非结构化文本（文档、wiki）很有效。文件操作是确定的（Exact Path）。代码、配置文件、CSV 数据，这些都是高度结构化的。在这些场景下，我们不需要“模糊的相似片段”，我们需要的是“精准的完整内容”。

如果在开发中发现 Agent 总是写出不能运行的代码，或者分析数据时总是产生幻觉，很有可能是因为 RAG 喂给它的信息太碎了，丢失了文件本身的逻辑结构。这时候，引入文件系统工具可能是更好的解法。

实际开发中的启示

结合这篇文章，对于未来的 Agent 开发（特别是处理复杂任务的 Agent），我认为有两点值得注意：

1. 给 Agent 一个 Workspace（工作区）

现在的很多 Agent 还是无状态的。聊完即焚。

如果要让 Agent 真的能干活，必须给它挂载一个持久化的目录。让它把中间生成的图表、代码、日志都写进去。这不仅是为了持久化，更是为了让 Agent 能分步骤处理任务。比如第一步分析结果写在 step1.txt，第二步只读 step1.txt 继续干，这样能极大地节省 Token。

2. 甚至可以不用 RAG

对于代码库问答或者小型项目分析，与其费劲做向量化，不如直接给 Agent 一个 Grep 工具和文件读取权限。让 Agent 自己像程序员一样去 grep 关键词，去翻看文件。这种方式获取的信息往往比向量检索更精准，因为它符合代码的逻辑链路。

总结

LangChain 这篇文章其实是在给“盲目追求长上下文”和“万物皆 RAG”的趋势降温。

它提醒我们：文件系统是计算机科学中最基础、最可靠的状态管理工具。

当我们将文件操作封装成 Tool 交给 LLM，我们实际上是赋予了它一种管理自身注意力的能力。对于构建真正能解决复杂工程问题的 Agent 来说，这种能力比单纯扩大 Context Window 要经济和实用得多。

普通人如何抓住AI大模型的风口？

为什么要学AI大模型

当下，⼈⼯智能市场迎来了爆发期，并逐渐进⼊以⼈⼯通⽤智能（AGI）为主导的新时代。企业纷纷官宣“ AI+ ”战略，为新兴技术⼈才创造丰富的就业机会，⼈才缺⼝将达 400 万！

DeepSeek问世以来，生成式AI和大模型技术爆发式增长，让很多岗位重新成了炙手可热的新星，岗位薪资远超很多后端岗位，在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合，飞速发展，成为炙手可热的新风口，企业非常需要了解AI、懂AI、会用AI的员工，纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述

AI大模型开发工程师对AI大模型需要了解到什么程度呢？我们先看一下招聘需求：

在这里插入图片描述

知道人家要什么能力，一切就好办了！我整理了AI大模型开发工程师需要掌握的知识如下：

大模型基础知识

你得知道市面上的大模型产品生态和产品线；还要了解Llama、Qwen等开源大模型与OpenAI等闭源模型的能力差异；以及了解开源模型的二次开发优势，以及闭源模型的商业化限制，等等。

了解这些技术的目的在于建立与算法工程师的共通语言，确保能够沟通项目需求，同时具备管理AI项目进展、合理分配项目资源、把握和控制项目成本的能力。

产品经理还需要有业务sense，这其实就又回到了产品人的看家本领上。我们知道先阶段AI的局限性还非常大，模型生成的内容不理想甚至错误的情况屡见不鲜。因此AI产品经理看技术，更多的是从技术边界、成本等角度出发，选择合适的技术方案来实现需求，甚至用业务来补足技术的短板。

AI Agent

现阶段，AI Agent的发展可谓是百花齐放，甚至有人说，Agent就是未来应用该有的样子，所以这个LLM的重要分支，必须要掌握。

Agent，中文名为“智能体”，由控制端（Brain）、感知端（Perception）和行动端（Action）组成，是一种能够在特定环境中自主行动、感知环境、做出决策并与其他Agent或人类进行交互的计算机程序或实体。简单来说就是给大模型这个大脑装上“记忆”、装上“手”和“脚”，让它自动完成工作。

Agent的核心特性

自主性： 能够独立做出决策，不依赖人类的直接控制。

适应性： 能够根据环境的变化调整其行为。

交互性： 能够与人类或其他系统进行有效沟通和交互。

对于大模型开发工程师来说，学习Agent更多的是理解它的设计理念和工作方式。零代码的大模型应用开发平台也有很多，比如dify、coze，拿来做一个小项目，你就会发现，其实并不难。

AI 应用项目开发流程

如果产品形态和开发模式都和过去不一样了，那还画啥原型？怎么排项目周期？这将深刻影响产品经理这个岗位本身的价值构成，所以每个AI产品经理都必须要了解它。

看着都是新词，其实接触起来，也不难。

从0到1的大模型系统学习籽料

最近很多程序员朋友都已经学习或者准备学习 AI 大模型，后台也经常会有小伙伴咨询学习路线和学习资料，我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师（吴文俊奖得主）
在这里插入图片描述

给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料，这些学习资料不仅深入浅出，而且非常实用，让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。
在这里插入图片描述

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入，精准学习显得尤为重要。一份系统的技术路线图，不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点，还能提供一条高效、有序的学习路径。

基础篇，包括了大模型的基本情况，核心原理，带你认识了解大模型提示词，Transformer架构，预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门AI大模型
进阶篇，你将掌握RAG，Langchain、Agent的核心原理和应用，学习如何微调大模型，让大模型更适合自己的行业需求，私有化部署大模型，让自己的数据更加安全
项目实战篇，会手把手一步步带着大家练习企业级落地项目，比如电商行业的智能客服、智能销售项目，教育行业的智慧校园、智能辅导项目等等

但知道是一回事，做又是另一回事，初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性，在这基础上，找到高质量的学习资源，不浪费时间、不走弯路，又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式，可以更直观地展示过程，能有效提升学习兴趣和理解力，是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

海量AI大模型必读的经典书籍（PDF）

阅读AI大模型经典书籍可以帮助读者提高技术水平，开拓视野，掌握核心技术，提高解决问题的能力，同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说，阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告（实时更新）

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下
在这里插入图片描述

在这里插入图片描述

AI时代，企业最需要的是既懂技术、又有实战经验的复合型人才，**当前人工智能岗位需求多，薪资高，前景好。**在职场里，选对赛道就能赢在起跑线。抓住AI这个风口，相信下一个人生赢家就是你！机会，永远留给有准备的人。

如何获取？

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【事件触发一致性】研究多智能体网络如何通过分布式事件驱动控制实现有限时间内的共识（Matlab代码实现）

由于非光滑控制和触发条件引起的混合非线性，事件驱动控制下的有限时间共识分析比连续时间控制更具挑战性。我们研究了具有单积分器动态和标量状态的智能体，并提出了一种用于有限时间共识的分布式事件驱动控制协议，并与连续时间控制进行了比较。结果表明，使用所提出的事件驱动控制方案，智能体可以在有限时间内达成共识，并且不会出现Zeno行为。我们还得到了一个关于收敛时间的估计，并证明它不仅与初始条件和网络连通性有关

2048 AI社区

LLM(大语言模型) 的本质是概率

不会类比，不懂共情(这两点一向是被计算机背景的理工群体鄙视的)，没有泛化能力，无法举一反三，不会归纳演绎，这才是 AI 的瓶颈，而不是铺天盖地的算力，以及那些以为 scale 就够了的能力，但在本质上，只要 AI 仍然是个概率预测机器，那些 scale up 也好，scale out 也好，都仍然在做概率预测，正如它们名字一样，规模扩大了而已。这个过程最精妙的结果是，在交叉熵损失和 Softmax