谷歌炸场！Gemini 3 Deep Think 升级直达物理+化学奥赛金牌，科研 AI 时代正式开启

2026年2月12日，谷歌正式宣布对推理模式进行重大升级。这款专为复杂科学、研究与工程场景打造的“深度思考”模式，在与各领域科学家、研究人员深度合作后，能力迎来飞跃式提升。它专攻那些边界模糊、数据杂乱、没有唯一解的真实世界难题，正把大模型从“聪明助手”推向“科研伙伴”的新时代。

systeminof

33人浏览 · 2026-02-13 14:17:59

systeminof · 2026-02-13 14:17:59 发布

2026年2月12日，谷歌正式宣布对 Gemini 3 Deep Think 推理模式进行重大升级。这款专为复杂科学、研究与工程场景打造的“深度思考”模式，在与各领域科学家、研究人员深度合作后，能力迎来飞跃式提升。它专攻那些边界模糊、数据杂乱、没有唯一解的真实世界难题，正把大模型从“聪明助手”推向“科研伙伴”的新时代。

升级背景：为什么需要“Deep Think”？

现代科研与工程问题往往充满不确定性：实验数据噪声大、理论模型不完备、跨学科交叉复杂。传统大模型在简单问答或标准任务上表现出色，但在高难度开放式问题上仍显吃力。Deep Think 正是为此而生，通过强化多步链式推理、抽象概括能力和领域知识深度整合，针对“无清晰路径”的难题提供可靠支持。

此次升级后，Deep Think 从2月12日起已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。同时，谷歌首次通过 Gemini API 向部分研究人员、工程师和企业推出“早期访问计划”，开放申请通道，加速其在真实科研流程中的落地。

Gemini 3 Deep Think rolls out to paid subscribers | Mashable

How to Use Gemini 3: The New “Deep Think” Mode Explained (Plus the “Antigravity” Feature No One Is Talking About) | by Shadhujan Jeyachandran | Generative AI

图1-2：Gemini 3 系列标志性界面与 Deep Think 模式视觉呈现，展现谷歌最新前沿 AI 的科技感。

硬核基准表现：多项金牌级突破

谷歌官方公布的最新成绩令人震撼（全部无外部工具、独立验证）：

Humanity's Last Exam（终极人类考试，无工具）：48.4% —— 创下新标准，远超多数前沿模型。
ARC-AGI-2（抽象推理基准，由 ARC Prize Foundation 验证）：84.6% —— 创纪录表现，真正接近人类级抽象概括能力。
Codeforces（竞赛编程 Elo 分）：3455 —— 全球仅约 7 人能超越，编程推理已达人类顶级专家水平。
International Math Olympiad 2025（IMO 2025）：金牌级表现。
International Physics Olympiad 2025（IPhO 2025 理论部分）：87.7% —— 金牌区间。
International Chemistry Olympiad 2025（IChO 2025 理论部分）：82.8% —— 金牌级别。
CMT-Benchmark（凝聚态理论物理基准）：50.5% —— 在大学/研究所级前沿理论问题上展现显著潜力。