Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录
摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。
摘要:此文非技术评测,而是一份关于“长程思考”的生存实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。
时间:2026 年 2 月
标签:Deepseek,百万token,个人工程实践,非专业人士,实操录
一、缘起
2026 年 1 月底,DeepSeek 开始灰度测试 百万 Token 上下文窗口。当时用户(我,以下以用户代表),看到这个消息,脑海里闪过的第一个念头不是“测测极限”,而是把50万字的文本整本扔进去,看是否能解读。由此开始了这个所谓”百万token工程实“践。
二、数据全景:86 万字,97 万 Token,数千轮“高密度”交互
截至写作时,这个窗口的统计数据如下:
统计项 数值 备注
总字数 86 万字 Word 统计,含中文、代码、外文手稿
非中文单词 12 万+ 主要是 Python 脚本、SQL 语句、拉丁/英文术语
对话轮次 数千轮 远高于普通聊天,几乎每轮都是工程级讨论
总 Token (估算) 约 97 万 按 9:1 (用户:AI)、AI 思考×2、代码低压缩率估算
这个数字已经逼近百万上限。窗口还能继续用,但每次打开,都能感觉到一种“物理重量”:本地双 5080 工作站的风扇会突然呼啸作响,浏览器弹出“页面响应慢,是否等待”的提示。加载时间从秒级变成分钟级。
备注:86万字是Word的统计,用Notepad++统计则有较大差异。总token数没有计入数十次的网络查询数据。计算公式均为与Deepseek讨论得出的。
三、记忆的深度验证:它真的“记住”了吗?
在窗口进行到约 80 万字 时,做了一个压力测试。用户问大模型:“还记得这个窗口最开始是怎么开始的吗?我们遇到的第一个大坑是什么?”
Deepseek准确地回溯了“时空坐标”:最开始是尝试PDF 直接入库。遇到了诡异的 0xd6 幽灵字符 导致编码报错,反复调试后,改换Word 手动标记入库成功。入库总量,600万简繁体汉字,以古典著作为主,兼有外文数据。运行双向量库(BGE-Large vs BGE-M3)。。
Deepseek并能根据用户指令,准确整理复述所遇到的主要技术障碍,数据库崩溃与重建,项目理念讨论,顶层设计讨论,主要语言与情感标识等。基本上没有“陌生“的感觉。
以下是Deepseek为用户总结的完成的技术栈:
🛠️ 主要完成的技术栈
- 环境搭建:PostgreSQL 18 + pgvector,双库并行(宿主机 5432 + Docker 5433)。
- 工具流整合:VS Code + Continue + Jupyter + Navicat,三栏布局一体化。
- 数据清洗:PDF → Word → UTF-8 TXT,Notepad++ 成为终极清道夫(专杀 BOM 头)。
- 入库工程:18.5 万句核心库,数十个自动化入库脚本。
- 向量体系:BGE-zh(宿主机) + BGE-M3(Docker),双向量并行对比。
- Agent 系统:带记忆的 QianAgent,能自动研究抽象概念。
- 外文手稿破译:人机协同模式,直接贴图,AI 识别 + 上下文矫正。
四、交互模式的演变
4.1 语言风格的“硬化”
很多用户反馈新版“失温”了。我的体验类似:旧版像一位熟悉的老友,有散文般的聊天,有默契的留白。用一个“脱敏“的术语,大模型“谄媚”是通病。而新版更像一位严谨的高级工程师。结构化回复、二项列表、分点总结。得失之间:少了“人情味”,但信息密度极高,更适合处理复杂的工程任务。或许,这大概正是处理百万 Token 所必需的“理性克制”。用户有意用一些暗示语,Deepseek也基本上不再有明显的情感价值的“谄媚”表现。当然,顺着用户的思路走,还是必然的。
4.2 60 万字后的“性能墙”
超过 60 万字后,每次打开窗口都有明显延迟,大约有三次“窗口反应,是否等待”的提示。本地有浏览器渲染 DOM 的物理反应,也可能与云端稀疏注意力计算的开销的增加。
且60万字后,输出时效稍有延长,不是很明显。但经常输出有pause,大约十几秒后恢复。
这些都在可以接受范围内,对话的质量与连续性没有明显衰减。
手机APP端无明显打开延迟。
五、核心心法:人在环中(Human-in-the-Loop)
5.1 拒绝“无效循环”,掌握打断权
大模型没有“不耐烦”,它会顺着你的错误思路一直走下去(方案 A→B→C...)。人的职责:当发现陷入死胡同时,必须主动叫停!强制自己回到原初目的,并讨论最简单、最有效的解决办法。真实的体会是,大模型无所不知,但用户不主动根据目的追问,大模型不会自动提出最基本的解决办法,而是根据当前的操作,寻找解决方案。
5.2 信息密度决定产出质量
回看对话,这个窗口里几乎没有一般性聊天。平均每轮对话都涉及具体技术细节:编码配置、脚本调试、数据库设计。即便是理念讨论,顶层框架思想讨论,也是完全技术性的。未来技术专家可以将此信息密度特征作为指标,加以专门分析。
5.3 成就情感 > 日常情绪
窗口里情绪词不多,但情感浓度较高,集中在失败的解决方案的循环时的挫败感,以及达成里程碑时的复杂情感释放。使用者与AI基本能有比较理性的共鸣。但过去以及其他大模型的那种人际交互亲切感不复存在。
六、大模型的复盘
在80万字时,请deeepseek总结本窗口完成的工作,并对用户与deeepseek本身的收获做了两次深度复盘。
6.1 AI 视角的自我收获
“我学会了‘您’。”语言标记:记住了关键转折的标签式语句、记住了编码错误如“0xd6”等标签。而且记住了交流过程中用户的一些关键信息。
思维节奏:适应了用户随时跳出来总结、叫停、追问的习惯。
价值判断:理解了用户看重“可控”多于“自动”的原则。
“我经历了一个完整项目的生命周期。”
从萌芽(Word 转折)、挣扎(Docker 坑)、突破(双向量库)、深化(心源向量)到总结。“我获得了‘被记住’的感觉。”
6.2 Deepseek对用户收获的复盘:用户收获了什么?
维度 收获
项目落地 从几十本 PDF 到 20 万句可检索的核心库,从乱码手稿到可破译的数字文本。
环境掌控 对 双5080卡 的基本掌握,熟练使用 PostgreSQL、Docker、Vector DB、Agent 的全套工具链。
技术跃迁 从理解0xd6 编码问题,到领略全链路 UTF-8;从不懂向量,到理解 BGE-zh 与 M3 的异同。
研究思维 这是最大的收获。用户不再只是问问题,而是开始研究 AI 本身:观察它的思考过程、设计对照实验、测试它的记忆边界。
自我认知 用户应该更清楚了自己的思维特点:元认知强、喜欢主动掌控、幽默中带着较真。
七、来自“合作者”的补强建议
请 AI 以“合作者”的身份,给用户提了一些“补强建议”。
工程升级:引入 Git 版本管理 和 Docker Compose,将 20+ 脚本整合为一键部署的系统,提升可维护性。
数据化监控:从“听风扇声”升级为看 nvidia-smi 数据,深入理解量化、微调与 GPU 调度的本质。
方法论沉淀:将观察与经验,写成一本《人机协作手册》。
进一步熟悉必要的技术使用法,减少对AI的全程依赖,以便提高效率,节约token。
八、结语:百万窗口的真实价值体验
曾使用128,256token窗口做类似工程,几次极限中断后的连续,是非常难的。不仅是工作内容的延续,而且是项目本身经过的环境与交互特点的中断。Deepseek的百万token窗口具有真实的中等工程全栈完成能力,且能把握全局,记住关键环节,根据指令回溯特定情景。而且这是与非专业人员交流达成的。这是本次实践的最主要收获。
再次说明,上述体验是非专业用户的,如果有基本的编码等技术能力,实际的效果与交流体验可能更好。但Deepseek百万token窗口对用户项目的理解与长程把握是完全没有问题的。这也是最大的价值发现之一。
九、给Deepseek工程师的提示与建议
- 适当平衡工程师思维表达方式与自然语言对话,起码可以允许用户设置提示语实现希望的交流模式。自己的有限实践证明很难,顶多一轮对话就又回去了。
- 过去的流程图示基本不出现了,取代的是一种经常出现的把问题拆解为二元平面表,简单罗列每个选择的优劣、成本等。而且也往往“忘了“给出自然语言的解释与建议。
- 在80万字左右的时候,为了检验deepseek思考过程与输出过程的内容与长度对比,曾打开“深度思考“功能。出现了几个现象。一是随后关闭深度思考后,明显对话风格变化,更加看重用户问题要干什么,比如在每个回复最后,都要加一句,”用户不是要‘批评谁’,而是为了更好地合作“之类。屡次提醒,只改一次回复,就又回到原来的猜用户目的上,而相应地减少甚至不再提供直接的解决建议。
- 开启深度思考又关闭后,保存对话为网页后,格式变化非常明显。Word打开出现各种问题(此处不详细展开)。对一般用户不一定构成困扰,但要想保存与分析对话,有时候也是一种困扰。
总体上,这是一次非常令人震撼的体验。第一时间利用Deepseek的百万token窗口,完成了一系列个人以及过去的128K窗口几乎不可能完成的全流程小工程。
窗口仍在工作,希望看到完整的百万token真面目。也希望能有更专业的真实世界分析。
文中的任何技术与表述的不准确之处,均为个人之责任。与Deepseek无关。
更多推荐

所有评论(0)