最近的 AI 圈,热闹得像过年。

谷歌发布了 Gemini 3 和大香蕉 Nano Banana Pro

OpenAI 掏出 GPT-5.1 应对。

Anthropic 这边也迭代出了 Claude Opus 4.5

马斯克的 xAI 更是疯狂,Grok 4.1 Fast 直接免费开放,短短几天就以 1.16T tokens 的用量登顶了 OpenRouter 排行榜。

是的,你没有看错,万亿。

大家打得不亦乐乎。

但有个熟悉的名字,似乎很久没出现了。

DeepSeek呢?

昨晚,答案揭晓。

北美时间 11 月 27 日,也就是感恩节当天,DeepSeek 悄悄在 Hugging Face 上传了一个新模型:DeepSeekMath-V2

这是一个在国际数学奥林匹克竞赛(IMO)上达到金牌水平的「数学推理模型」。

免费开源;Apache 2.0 协议;权重全部公开。

Hugging Face 的 CEO Clement Delangue 直接发帖盛赞:

“想象一下,免费拥有世界上最顶尖数学家之一的大脑。据我所知,目前没有任何聊天机器人或 API 能让你免费访问 IMO 2025 金牌水平的模型。这是 AI 和知识民主化的最佳体现。

AI 的前沿,是开源的。”

OpenAI 和谷歌的 IMO 金牌模型要么还在实验室里,要么仅对最高等级的付费用户开放,大多数人用不了。

DeepSeek 直接把同等水平的模型完全免费开源了。

所以 Clement 说得,没毛病。


01|到底有多强?

先看成绩单。

IMO 2025,国际数学奥林匹克,被公认为全球最难的高中数学竞赛。

今年参加的 630 名学生中,只有 72 人拿到了金牌,比例不到 12%。

总共 6 题,DeepSeekMath-V2 解出 5 题,拿到 35 分,达到了金牌水平。

中国数学奥林匹克(CMO 2024),同样是金牌水平。

但更猛的是 Putnam 2024。

这是北美最负盛名的大学生数学竞赛,满分 120 分。

今年人类选手的最高分是 90 分,中位数只有 2 分。没错,大部分参赛者只拿到了 2 分。

MIT 连续五年包揽前五名,他们的“普特南研究员”能拿到的最高分也是 90。

DeepSeekMath-V2 得了多少?

118 分。

12 道题,解出 11 道完整答案,剩下 1 道只有小错误。

超过人类最高分整整 28 分。


02|这不是第一个 IMO 金牌模型,但意义完全不同

今年 7 月,OpenAI 和谷歌的模型也在 IMO 2025 上拿到了金牌,同样是 6 题解 5 题,35 分。

但,他们都是闭源的。

OpenAI 的金牌模型至今还是“实验性”的,没有公开发布。

谷歌倒是在 8 月把 Gemini 2.5 Deep Think 开放了,但仅限 Ultra 订阅用户,每月 249.99 美元,约 1800 元人民币。

并且,这里有个关键细节:Ultra 用户拿到的是降级版,只有铜牌水平。

真正在 IMO 上拿金牌的那个版本,需要数小时来推理一道题,只开放给了“少部分数学家和学者”。

说人话,OpenAI 和谷歌的金牌模型,要么还在实验室里,要么藏在付费墙后面还缩了水。

DeepSeekMath-V2 不一样。

Apache 2.0 协议,权重完全公开,你可以下载、研究、微调、商用。

无需付费,没有降级版。

所以说,DeepSeek 一出手,局面就变了。


03|会自我验证的 DeepSeekMath-V2

DeepSeek 在技术文档里指出了一个很容易被忽视的问题:正确的答案不等于正确的推理。

这话乍一听有点反直觉,但也不难想明白。

现在的 AI 模型在 AIME、HMMT 这些数学竞赛上已经能拿很高分。

但问题是,它们到底是在“蒙”,还是真的能推理出严谨的证明过程?

数学证明需要严格的逻辑推导,每一步都要有理有据。

而传统的模型训练方法只奖励“答案对不对”,根本管不了推理过程。

DeepSeek 给出的解决方法叫「Self-Verifiable」(自验证),核心思路是把 AI 拆成两个角色。

一个是「生成器」,负责写证明。

另一个是「验证器」,专门检查每一步推导是否严谨、逻辑链有没有断裂。

验证器打出的分数,就是生成器的“奖励信号”。

但这里有个关键设计:DeepSeek 不只是让生成器追求高分,而是鼓励它在提交最终答案前,主动发现并修复自己的错误。

更妙的是,为了防止生成器掌握套路、学会“糊弄”验证器,DeepSeek 会持续提高验证难度。

生成器变强,验证器也跟着变强。

那么,这种「生成器-验证器」架构的效果怎么样?

在 CNML 级别的数学证明测试中,DeepSeekMath-V2 在代数、几何、数论、组合、不等式五个分支上全面领先。

尤其是几何。

DeepSeekMath-V2 拿到 0.52,GPT-5只有可怜的 0.15,直接是三倍多的差距。

元旦,DeepSeek 发布 V3,惊艳出圈。

春节,R1 上线,炸翻硅谷。

端午节,悄悄更新 R1-0528,网友实测后直呼“这也叫小版本升级?”。

现在感恩节,又开源一个 IMO 金牌数学模型。

节假日发布新模型,那个我们熟悉的蓝色小鲸鱼,它一直都在。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

在这里插入图片描述

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述
在这里插入图片描述

03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述
在这里插入图片描述

04.大模型面试题目详解

在这里插入图片描述

在这里插入图片描述

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

在这里插入图片描述
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐