2026 开年第一炸!陈天桥的这个新模型,治好了 AI 的「幻觉」
2026 开年第一炸!陈天桥的这个新模型,治好了 AI 的「幻觉」
DeepSeek-V4 什么时候发布?
我拿这个问题测了四个 AI。
ChatGPT 说「预计 2025 年 10 月前后」。问题是,现在已经 2026 年 1 月了。
Claude 说「春节前后」,没给依据。Gemini 说「2 月中旬」,也没说为什么。
第四个是 MiroThinker(dr.miromind.ai),一个 30B 参数的小模型。
它说「大概率 2 月 17 日,农历正月初一」。
然后给了四条证据链,区分了「能确定的」和「需观望的」,最后还给了业务排期建议。

同一个问题,回答质量差了一个量级。
它背后的模型叫 MiroThinker 1.5,1 月 5 日刚发布。
01|它是怎么得出「2 月 17 日」的
MiroThinker 没有直接给结论。
它先列了一个调查计划:官方论文节奏、去年 R1 时间线、mHC 论文措辞、中英文媒体报道、社交平台爆料。
五个方向,逐个搜索,全程可见。

最后的证据链是这样的。
去年 R1 是 1 月 20 日发的,春节前一周。DeepSeek 有「春节档发新品」的传统。
今年元旦的 mHC 论文里有一句「结论已通过内部大规模实验进一步证实」,这句话在之前的 NAS 论文里没出现过。MiroThinker 判断这可能暗示 V4 训练已完成。
多个媒体和社交平台的消息源,都指向同一个日期:2 月 17 日。
它还专门做了交叉验证:2026 年农历正月初一,确实是公历 2 月 17 日。

它甚至还区分了「能相对确定的」和「仍需观望的」,官方尚未发布正式公告,不排除因技术或监管原因顺延。
最后给了可操作建议:如果你要在业务里排期,按「春节后 1-2 周」做缓冲。
这些都是「查了信息源,交叉验证后推理出来的」。
而 ChatGPT 在 2026 年 1 月还在说「2025 年 10 月」。
这就是典型的「幻觉」,模型不知道自己不知道。
02|又测了一道题
再来一题。
英伟达 2026 年股价怎么走?现在该买还是该卖?
这种问题,普通 AI 会说「我无法提供投资建议」,然后给你一堆免责声明。
MiroThinker 不一样。
它搜索了十几轮。先搜当前股价和估值,再搜分析师评级和目标价,然后是基本面数据、AI 芯片市场预测、竞争格局、地缘政治风险、技术面支撑位和阻力位。


结论是:当前股价 188 美元左右,华尔街平均目标价 250-270 美元,理论上还有 30-45% 上涨空间。但估值已经在高位,TTM 市盈率 46-47 倍,任何季度业绩不及预期都可能触发 20-30% 的回调。

更有意思的是,它区分了用户类型。
长期投资者,能扛 30% 回撤?现在更接近「可以分批买」的区间。
短线玩家,或者已经有大额浮盈?更接近「逢高减仓锁盈」的区间。
刚高位接盘压力很大?建议「降低仓位 + 拉长周期」,而不是情绪化止损。

它甚至给出了一个可执行的方案。把资金分 3-4 份,按价格区间慢慢买;设一个危险线,比如跌破成本价 25-30% 再集中审视;股价冲到 260-280 区间可以卖一半锁定利润。
最后它说,「我不能告诉你该买还是该卖,但基于以上信息,你可以自己判断。」

这才是正确的姿势。不是拒绝回答,是把决策所需的信息给你。
03|30B 凭什么打赢 1T
MiroThinker 1.5 是 MiroMind 的产品。创始人是陈天桥和代季峰。
陈天桥是盛大的创始人。代季峰是清华大学电子工程系副教授,论文引用 6 万次,CVPR 最佳论文奖得主。
MiroThinker 1.5 有两个版本:30B 和 235B。
235B 版本在 BrowseComp 测试里拿下 69.8% 的准确率,刷新了 ChatGPT Agent(68.9%)的纪录。
30B 版本 56.1%,但推理成本只有 0.07 美元一条,是 Kimi-K2-Thinking 的二十分之一,而且推理更快。

为什么小模型能打赢大模型?
过去两年大模型的主流逻辑是「大力出奇迹」。参数越多越好,把整个互联网语料背进脑子里,祈祷它能答对。
但这条路有个问题,知识会过时。
MiroMind 换了个思路:「不让模型死记硬背,教它查资料。」
他们管这个叫 Interactive Scaling。把算力花在对外交互上,而不是内部记忆上。

传统模型像做题家,背了一肚子知识,遇到新题从记忆里找最像的答案。
MiroThinker 像科学家,不确定就去查,查到矛盾就修正,直到证据收敛。
04|为什么它知道「现在是 2026 年」
普通大模型训练时有个问题,它在数据里早就「见过结果」了。很多时候不是在预测,是在复述。
MiroThinker 的训练加了一层约束,模型只能看到「当前时间点之前」的信息。
这叫「时序敏感训练沙盒」。杜绝「开天眼」,以上帝视角作弊。
这就是为什么有的 AI 会在 2026 年还在说「2025 年 10 月」,而 MiroThinker 能准确判断「现在是 2026 年 1 月,V4 还没发,根据最新信息推测是 2 月 17 日」。
新模型发布两天,已经有不少人用起来了。
评论区有人说「体验了一下,确实可以跟 GPT 扳手腕」,有人说「本地跑了一下,目前 30B 模型的 SOTA」,还有人直接给它起了个外号——「ChatGPT pro 青春版」。
搜索能力被提到最多,「单论搜索,确实有点东西」「实时搜索能力太强了」。

国外开发者的反应也差不多。
有人说「What is this magic?」,有人说「the thing is impressive, even in no pro mode」。
划重点
MiroThinker 1.5 体验地址:dr.miromind.ai,开源,免费。
Hugging Face 模型下载:https://huggingface.co/miromind-ai/MiroThinker-v1.5-235B
Github 代码库:https://github.com/MiroMindAI/MiroThinker
它不会直接给你答案,但会告诉你答案是怎么来的。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。
关注「AI信息Gap」,让 AI 成为你的外挂。
更多推荐



所有评论(0)