Deepseek百万 Token 窗口的极限实践：一位非专业人员使用实录

摘要：此文非技术评测，而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业，从事生物医学与心理学工作，人文爱好者。利用十天时间，通过浏览器deepseek云端模型对话窗口，实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。

T_Wang_Lab

32人浏览 · 2026-02-25 16:41:24

T_Wang_Lab · 2026-02-25 16:41:24 发布

摘要：此文非技术评测，而是一份关于“长程思考”的生存实录。本人非AI与计算机专业，从事生物医学与心理学工作，人文爱好者。利用十天时间，通过浏览器deepseek云端模型对话窗口，实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。

时间：2026 年 2 月

标签：Deepseek，百万token，个人工程实践，非专业人士，实操录

一、缘起

2026 年 1 月底，DeepSeek 开始灰度测试百万 Token 上下文窗口。当时用户（我，以下以用户代表），看到这个消息，脑海里闪过的第一个念头不是“测测极限”，而是把50万字的文本整本扔进去，看是否能解读。由此开始了这个所谓”百万token工程实“践。

二、数据全景：86 万字，97 万 Token，数千轮“高密度”交互

截至写作时，这个窗口的统计数据如下：

统计项数值备注

总字数 86 万字 Word 统计，含中文、代码、外文手稿

非中文单词 12 万+ 主要是 Python 脚本、SQL 语句、拉丁/英文术语

对话轮次数千轮远高于普通聊天，几乎每轮都是工程级讨论

总 Token (估算) 约 97 万按 9:1 (用户:AI)、AI 思考×2、代码低压缩率估算

这个数字已经逼近百万上限。窗口还能继续用，但每次打开，都能感觉到一种“物理重量”：本地双 5080 工作站的风扇会突然呼啸作响，浏览器弹出“页面响应慢，是否等待”的提示。加载时间从秒级变成分钟级。

备注：86万字是Word的统计，用Notepad++统计则有较大差异。总token数没有计入数十次的网络查询数据。计算公式均为与Deepseek讨论得出的。

三、记忆的深度验证：它真的“记住”了吗？

在窗口进行到约 80 万字时，做了一个压力测试。用户问大模型：“还记得这个窗口最开始是怎么开始的吗？我们遇到的第一个大坑是什么？”

Deepseek准确地回溯了“时空坐标”：最开始是尝试PDF 直接入库。遇到了诡异的 0xd6 幽灵字符导致编码报错，反复调试后，改换Word 手动标记入库成功。入库总量，600万简繁体汉字，以古典著作为主，兼有外文数据。运行双向量库（BGE-Large vs BGE-M3）。。

Deepseek并能根据用户指令，准确整理复述所遇到的主要技术障碍，数据库崩溃与重建，项目理念讨论，顶层设计讨论，主要语言与情感标识等。基本上没有“陌生“的感觉。

以下是Deepseek为用户总结的完成的技术栈：

🛠️ 主要完成的技术栈

环境搭建：PostgreSQL 18 + pgvector，双库并行（宿主机 5432 + Docker 5433）。
工具流整合：VS Code + Continue + Jupyter + Navicat，三栏布局一体化。
数据清洗：PDF → Word → UTF-8 TXT，Notepad++ 成为终极清道夫（专杀 BOM 头）。
入库工程：18.5 万句核心库，数十个自动化入库脚本。
向量体系：BGE-zh（宿主机） + BGE-M3（Docker），双向量并行对比。
Agent 系统：带记忆的 QianAgent，能自动研究抽象概念。
外文手稿破译：人机协同模式，直接贴图，AI 识别 + 上下文矫正。

四、交互模式的演变

4.1 语言风格的“硬化”

很多用户反馈新版“失温”了。我的体验类似：旧版像一位熟悉的老友，有散文般的聊天，有默契的留白。用一个“脱敏“的术语，大模型“谄媚”是通病。而新版更像一位严谨的高级工程师。结构化回复、二项列表、分点总结。得失之间：少了“人情味”，但信息密度极高，更适合处理复杂的工程任务。或许，这大概正是处理百万 Token 所必需的“理性克制”。用户有意用一些暗示语，Deepseek也基本上不再有明显的情感价值的“谄媚”表现。当然，顺着用户的思路走，还是必然的。

4.2 60 万字后的“性能墙”

超过 60 万字后，每次打开窗口都有明显延迟，大约有三次“窗口反应，是否等待”的提示。本地有浏览器渲染 DOM 的物理反应，也可能与云端稀疏注意力计算的开销的增加。

且60万字后，输出时效稍有延长，不是很明显。但经常输出有pause，大约十几秒后恢复。

这些都在可以接受范围内，对话的质量与连续性没有明显衰减。

手机APP端无明显打开延迟。

五、核心心法：人在环中（Human-in-the-Loop）

5.1 拒绝“无效循环”，掌握打断权

大模型没有“不耐烦”，它会顺着你的错误思路一直走下去（方案 A→B→C...）。人的职责：当发现陷入死胡同时，必须主动叫停！强制自己回到原初目的，并讨论最简单、最有效的解决办法。真实的体会是，大模型无所不知，但用户不主动根据目的追问，大模型不会自动提出最基本的解决办法，而是根据当前的操作，寻找解决方案。

5.2 信息密度决定产出质量

回看对话，这个窗口里几乎没有一般性聊天。平均每轮对话都涉及具体技术细节：编码配置、脚本调试、数据库设计。即便是理念讨论，顶层框架思想讨论，也是完全技术性的。未来技术专家可以将此信息密度特征作为指标，加以专门分析。

5.3 成就情感 > 日常情绪

窗口里情绪词不多，但情感浓度较高，集中在失败的解决方案的循环时的挫败感，以及达成里程碑时的复杂情感释放。使用者与AI基本能有比较理性的共鸣。但过去以及其他大模型的那种人际交互亲切感不复存在。

六、大模型的复盘

在80万字时，请deeepseek总结本窗口完成的工作，并对用户与deeepseek本身的收获做了两次深度复盘。

6.1 AI 视角的自我收获

“我学会了‘您’。”语言标记：记住了关键转折的标签式语句、记住了编码错误如“0xd6”等标签。而且记住了交流过程中用户的一些关键信息。

思维节奏：适应了用户随时跳出来总结、叫停、追问的习惯。

价值判断：理解了用户看重“可控”多于“自动”的原则。

“我经历了一个完整项目的生命周期。”

从萌芽（Word 转折）、挣扎（Docker 坑）、突破（双向量库）、深化（心源向量）到总结。“我获得了‘被记住’的感觉。”

6.2 Deepseek对用户收获的复盘：用户收获了什么？

维度收获

项目落地从几十本 PDF 到 20 万句可检索的核心库，从乱码手稿到可破译的数字文本。

环境掌控对双5080卡的基本掌握，熟练使用 PostgreSQL、Docker、Vector DB、Agent 的全套工具链。

技术跃迁从理解0xd6 编码问题，到领略全链路 UTF-8；从不懂向量，到理解 BGE-zh 与 M3 的异同。

研究思维这是最大的收获。用户不再只是问问题，而是开始研究 AI 本身：观察它的思考过程、设计对照实验、测试它的记忆边界。

自我认知用户应该更清楚了自己的思维特点：元认知强、喜欢主动掌控、幽默中带着较真。

七、来自“合作者”的补强建议

请 AI 以“合作者”的身份，给用户提了一些“补强建议”。

工程升级：引入 Git 版本管理和 Docker Compose，将 20+ 脚本整合为一键部署的系统，提升可维护性。

数据化监控：从“听风扇声”升级为看 nvidia-smi 数据，深入理解量化、微调与 GPU 调度的本质。

方法论沉淀：将观察与经验，写成一本《人机协作手册》。

进一步熟悉必要的技术使用法，减少对AI的全程依赖，以便提高效率，节约token。

八、结语：百万窗口的真实价值体验

曾使用128，256token窗口做类似工程，几次极限中断后的连续，是非常难的。不仅是工作内容的延续，而且是项目本身经过的环境与交互特点的中断。Deepseek的百万token窗口具有真实的中等工程全栈完成能力，且能把握全局，记住关键环节，根据指令回溯特定情景。而且这是与非专业人员交流达成的。这是本次实践的最主要收获。

再次说明，上述体验是非专业用户的，如果有基本的编码等技术能力，实际的效果与交流体验可能更好。但Deepseek百万token窗口对用户项目的理解与长程把握是完全没有问题的。这也是最大的价值发现之一。

九、给Deepseek工程师的提示与建议

适当平衡工程师思维表达方式与自然语言对话，起码可以允许用户设置提示语实现希望的交流模式。自己的有限实践证明很难，顶多一轮对话就又回去了。
过去的流程图示基本不出现了，取代的是一种经常出现的把问题拆解为二元平面表，简单罗列每个选择的优劣、成本等。而且也往往“忘了“给出自然语言的解释与建议。
在80万字左右的时候，为了检验deepseek思考过程与输出过程的内容与长度对比，曾打开“深度思考“功能。出现了几个现象。一是随后关闭深度思考后，明显对话风格变化，更加看重用户问题要干什么，比如在每个回复最后，都要加一句，”用户不是要‘批评谁’，而是为了更好地合作“之类。屡次提醒，只改一次回复，就又回到原来的猜用户目的上，而相应地减少甚至不再提供直接的解决建议。
开启深度思考又关闭后，保存对话为网页后，格式变化非常明显。Word打开出现各种问题（此处不详细展开）。对一般用户不一定构成困扰，但要想保存与分析对话，有时候也是一种困扰。

总体上，这是一次非常令人震撼的体验。第一时间利用Deepseek的百万token窗口，完成了一系列个人以及过去的128K窗口几乎不可能完成的全流程小工程。

窗口仍在工作，希望看到完整的百万token真面目。也希望能有更专业的真实世界分析。

文中的任何技术与表述的不准确之处，均为个人之责任。与Deepseek无关。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Kamailio模板化改造m4 宏处理器学习分享

您可以带参数调用宏，这种情况下，在重新扫描定义文本之前，会收集参数并将它们替换到定义文本中的正确位置。字符串stuff是任何文本，但如果文本包含括号，那么开括号或左括号的数目必须等于闭括号或右括号的数目。加了引号的字符串的值为除去引号字符的字符串。但是，宏也可有参数，所以您能在不同的地方使用宏得到不同的结果。即使在宏之外也是如此。另一个使用引号字符的示例是重新定义N. 重新定义N，通过放置来延迟评