谷歌发布 Gemini 3.1 Pro:面向复杂推理与长任务的新一代核心模型
上周,谷歌对 Gemini 3 Deep Think 进行了重大更新,聚焦科学、研究与工程场景中的复杂难题。紧接着,谷歌正式推出支撑这些能力升级的核心模型——Gemini 3.1 Pro。谷歌称,3.1 Pro 在 Gemini 3 系列基础上进一步强化推理能力与长任务处理方式,为开发者构建更可靠的自主智能体打下基础。
上周,谷歌对 Gemini 3 Deep Think 进行了重大更新,聚焦科学、研究与工程场景中的复杂难题。紧接着,谷歌正式推出支撑这些能力升级的核心模型——Gemini 3.1 Pro。谷歌称,3.1 Pro 在 Gemini 3 系列基础上进一步强化推理能力与长任务处理方式,为开发者构建更可靠的自主智能体打下基础。

参与 Gemini 3 Deep Think 研究的姚顺宇也在社交平台分享进展,并提到后续还会有更强的模型持续发布。

推理能力跃升:多项基准成绩显著提高
谷歌表示,Gemini 3.1 Pro 在解决复杂问题方面建立了更强的能力基准,并在多项测试中体现出明显进步。例如在 ARC-AGI-2(评估模型解决全新逻辑模式能力的基准)上,3.1 Pro 取得 77.1% 的经验证成绩,官方称其推理表现达到 3 Pro 的两倍以上。

此外,谷歌披露的内部评测显示,3.1 Pro 在多个专业领域保持竞争力:
- 科学知识:GPQA Diamond 94.3%
- 编码能力:LiveCodeBench Pro Elo 2887;SWE-Bench Verified 80.6%
- 多模态理解:MMMLU 92.6%
谷歌强调,这些进步不仅是“参数或分数的增量”,更关键在于模型对“思考 token”与长期任务执行方式的改进——这意味着在需要持续推理、分步完成的任务中,模型可能更稳定、更可控。
第三方评估:Gemini 3.1 Pro 被指登顶
第三方机构 Artificial Analysis 的评估显示,Gemini 3.1 Pro 已跃居其榜首。该评估还提到,3.1 Pro 的得分领先 Claude Opus 4.6 约 4 分,同时运行成本不到对方的一半(具体取决于调用场景与配置)。


从能力到落地:开发者与企业产品全面铺开
谷歌正在将 Gemini 3.1 Pro 部署到面向消费者与开发者的产品矩阵中,让能力升级进入日常使用。
上线/预览渠道包括:
- 开发者:Google AI Studio 的 Gemini API、Gemini CLI、智能体开发平台 Google Antigravity、Android Studio(预览)
- 企业:Vertex AI、Gemini Enterprise
- 消费者:Gemini App、NotebookLM
谷歌还提到,企业合作伙伴已开始整合 3.1 Pro 预览版,并反馈其在可靠性与效率方面有所提升。例如:
- Databricks CTO Hanlin Tang 表示,3.1 Pro 在其用于表格与非结构化数据“基于事实推理”的 OfficeQA 基准中取得同类最佳表现。
- Cartwheel 联合创始人 Andrew Carr 则强调模型对 3D 变换理解增强,并称其改善了 3D 动画流程中长期存在的一些问题(如旋转顺序相关漏洞)。
定价信息:分档计费、缓存与联网搜索另计
值得注意的是,Gemini 3.1 Pro 的定价结构相对复杂(以下为官方披露的关键条目):
- 输入价格:提示词 ≤20 万 token:$2 / 百万 token;>20 万 token:$4 / 百万 token
- 输出价格:提示词 ≤20 万 token:$12 / 百万 token;>20 万 token:$18 / 百万 token
- 上下文缓存:$0.20–$0.40 / 百万 token + $4.50 / 小时 / 百万 token 存储费
- 联网搜索(Grounding):每月前 5000 次提示免费,之后 $14 / 1000 次查询
3.1 Pro 能做什么:复杂主题可视化、数据整合与创意落地
谷歌将 3.1 Pro 定位为“解决简单答案解决不了的问题”的工具:它不仅能解释复杂概念,还能把零散信息结构化呈现,并推动创意项目产出可用成果。官方展示案例包括:
- 直接生成可用于网页的动效 SVG(如“鹈鹕骑自行车”等示例)
- 把复杂 API 与易用界面连接起来,搭建实时仪表盘(如接入公开遥测数据并可视化轨道)
- 生成复杂交互式设计与 3D 模拟代码,支持沉浸式体验
- 将文学主题转化为可用的前端作品集/网站风格实现

下一步:预览版先行,后续将全面开放
谷歌表示,Gemini 3.1 Pro 目前为预览版,后续将在自主工作流等方向继续推进,并计划进一步全面开放。与此同时,Gemini App 中 3.1 Pro 将逐步向 Google AI Pro 和 Ultra 套餐用户开放更高额度;NotebookLM 也已面向 Pro 与 Ultra 用户提供使用。
更多推荐



所有评论(0)