DeepSeek AI 近期悄然将网页端和 App 端模型的上下文窗口扩展至 100 万 Tokens,大幅提升了处理长文本的能力。此次升级使得模型能够一次性处理整本《三体》或大型代码库,且响应迅速。据传,这可能是即将发布的 DeepSeek V4 模型的预览版,V4 预计将进一步提升 AI 编程和代码智能能力,可能超越 OpenAI GPT 系列和 Anthropic 的 Claude 3.5 Sonnet。此次升级标志着国产大模型在长文本处理和推理能力上的显著进步,值得程序员和 AI 爱好者关注和收藏。


悄悄干大事,DeepSeek 又杀疯了。

塔猴 2 月 12 日报道,就在昨夜,国产 AI 圈又启惊雷!没有发布会,没有官方通稿,DeepSeek 悄悄开启新一轮灰度测试。

许多网友发现,自己的 DeepSeek 网页端和 App 端模型能力进化了,上下文窗口从原本的 128K 直接暴涨近 10 倍,达到了惊人的 100 万 Tokens

这意味着我们能把整本《三体》全集、一个中型项目的完整代码库,一次性上传,模型还能做到几乎过目不忘

更令人兴奋的是,据 Wavespeed、Vertu 等多家外媒报道,这次灰度测试很可能只是前菜,传说中的 DeepSeek V4 旗舰模型预计将在 2 月中旬(春节前后)正式登场,剑指地表最强

塔猴第一时间登录平台进行实测,带你看看这次版本升级到底有多强。

实测百万字长文

这次升级来得猝不及防

最早是在 Reddit 的 LocalLLaMA 板块和知乎上,有用户晒出截图,称自己在询问 DeepSeek “你的上下文限制是多少"时,模型竟然自曝,回答从"128k"变成了"1M”。

Reddit 网友热议 DeepSeek 更新

这一消息迅速引爆了开发者社区。塔猴实测发现,目前 DeepSeek App 和网页端已覆盖部分灰度用户。如果你想确认自己是否被选中,最简单的方法就是直接问它:"你的上下文窗口是多少?“或者"你的知识库截止到什么时候?”

塔猴在实测中发现,新版模型的知识库截止日期已更新至 2025 年 5 月。即便在非联网状态下,它也能准确回答出 2025 年 4 月发生的具体科技事件。

DeepSeek 知识库更新至 2025 年 5 月

1M Tokens 的吞吐量是什么概念?

以往我们处理长文档,往往需要使用 RAG(检索增强生成)技术,把书切碎了再喂给 AI,容易出现断章取义。而原生 1M 上下文,相当于让 AI 拥有了超强短期记忆

有测试用户尝试上传了超长的技术开发文档,模型不仅能迅速读取,还能跨越数百页进行逻辑关联推理。实际体验下来,DeepSeek 在处理长文本时的响应速度依然保持了秒数级水准,没有出现明显的卡顿。

对于需要分析财报的金融从业者,和需要阅读大量文献的科研人员来说,这绝对是一次质的飞跃

V4 旗舰春节压轴

如果说 1M 上下文是开胃菜,那么即将到来的 DeepSeek V4 才是真正的硬菜

综合多家媒体的消息,DeepSeek V4 预计将在 2026 年 2 月中旬,也就是春节期间正式发布。

目前的 1M 灰度测试,极有可能是 V4 版本的预览版或技术验证版。

据传,DeepSeek V4 将重点强化 AI 编程和代码智能能力。多项内部基准测试显示,其在编码任务上的表现已超越 OpenAI GPT 系列和 Anthropic 的 Claude 3.5 Sonnet

外媒关于 DeepSeek V4 的报道(来源 Vertu)

更有爆料称,V4 可能采取分级策略,推出 Lite 版和 Regular 版。其中 Regular 版本的参数规模或将突破万亿级,支持整代码库提示。

以后让 DeepSeek 编程,可以直接丢给它一个 GitHub 仓库,让它重构架构、查找深层 Bug、甚至从零写出一个新功能。对于程序员来说,这个春节可能有的忙了

从 RAG 到原生 1M

2025 年到 2026 年,大模型赛道的竞争焦点已从单纯的参数量,转移到了上下文窗口推理成本上。

DeepSeek 此次升级,再次印证了长文本是兵家必争之地。相比于依赖搜索的 RAG 技术,原生超长上下文随取随用,融会贯通。它解决了模型的记性差,让 AI 在处理复杂任务时更专业、可靠

作为国产 AI 的价格屠夫,DeepSeek 一直保持着开源与闭源并进的节奏。此次 V4 发布前夕的灰度测试,无疑是在向市场释放信号:

在高端算力与模型架构的赛场上,国产大模型依然在第一梯队

结语

2026 年开年,AI 圈的内卷没有丝毫停歇。

DeepSeek 这次默默的升级,展示了技术派厂商特有的硬核,不画饼,直接上干货。

随着 V4 发布日期的临近,我们有理由期待,国产大模型将在代码生成长文本推理领域带来更多惊喜。

温馨提示: 赶紧去网页端问问 DeepSeek:“你的上下文窗口是多少?”,看看你是不是那个被灰度选中的 1M 用户。欢迎在评论区晒出你的测试结果!

​最后

我在一线科技企业深耕十二载,见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​
在这里插入图片描述

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。

img
智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

在这里插入图片描述

​​
在这里插入图片描述

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​在这里插入图片描述
在这里插入图片描述

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐