Gemini 3 发布：创新 “Vibe Coding“，吊打全网，Agent 终极形态来了

谷歌发布Gemini3 AI模型，在推理能力上实现重大突破，拿下多项测试最高分。其创新点包括：1）推出"VibeCoding"概念，能理解模糊需求生成代码；2）DeepThink模式增强复杂问题解决能力；3）多模态交互更贴近真实场景。该模型不仅参数提升，更改变了人机交互方式，从工具向"思维伙伴"转变。这一突破引发对AI发展速度及其对人类影响的新思考。

人工智能研究所

1003人浏览 · 2025-12-11 11:45:00

人工智能研究所 · 2025-12-11 11:45:00 发布

以为 AI 圈最近风平浪静？谷歌刚刚反手甩出一枚核弹。Gemini 3 正式发布，不挤牙膏，直接碾压。它不仅拿下了最强推理的皇冠，更带来了一个全新的概念——Vibe Coding（氛围编码）。谷歌这次，是真的杀疯了。Google DeepMind 的 CEO Demis Hassabis 悄悄按下了发射键：Gemini 3 来了。

不是 PPT，不是画饼，是实打实的 Gemini 3 Pro 预览版，以及一个更神秘的 Gemini 3 Deep Think 模式。作为一个天天跟AI打交道的自媒体人，我见过太多"史上最强"的模型发布会。但看完Gemini 3的发布，我第一反应是：Google这次不只是在卷参数，它在悄悄改写人机关系的底层逻辑。这不是又一场性能榜单的军备竞赛，这是AI从"聪明工具"到"懂你伙伴"的跃迁。

01. 霸榜第一：告别“车轱辘话”

先看硬指标。在 AI 圈最权威的竞技场 LMArena 上，Gemini 3 Pro 拿下了 1501 Elo 的历史最高分。

什么概念？它不仅超过了之前的版本，更是在“人类最后的考试（Humanity's Last Exam）”中拿到了 37.5% 的高分（不使用工具）。

GPQA Diamond 91.9%：这是生物学、物理学、化学领域的大坑题集合。人类专家水平大概是65%，Gemini 3接近92%。我的天，它这是要抢教授的饭碗。

但最让我觉得恐怖的是ARC-AGI-2的45.1%。这个测试测的是AI面对全新问题的适应力，不是背题库。之前的顶尖模型都在30%挣扎，Gemini 3 Deep Think直接捅破了天花板。这说明它开始具备真正的"举一反三"能力，而不是高级复读机。

这些数字背后，Google在传达一个信号：别比了，我让半个身位你们都追不上。

但分高不代表好用。Gemini 3 最让我惊喜的，是谷歌终于改掉了 AI 最大的毛病——“说废话”。

官方明确表示，Gemini 3 的回复“摒弃了陈词滥调和奉承”。它不再是一个只会唯唯诺诺、说着“作为一个大语言模型...”的机器人，而是一个思想伙伴（Thought Partner）。它会直接给你深刻的见解，甚至是指正你的错误，告诉你“你需要听到的”，而不是“你想听到的”。

这才是 AI 进化的正确方向。我们需要的是一个敢于反驳、逻辑严密的智囊，而不是一个只会拍马屁的客服。

02. 绝活登场：什么是 "Vibe Coding"？

这是本次发布会最性感的词：Vibe Coding（氛围编码）。

以前写代码，你需要精准描述功能、逻辑、参数。但在 Gemini 3 面前，你可以说：“给我做一个类似赛博朋克风格的个人主页，感觉要酷，带点复古霓虹灯的调调。”

Gemini 3 就能捕捉这种模糊的 "Vibe"（氛围/感觉），直接生成可交互的 Web 界面。它在零样本生成方面表现极为出色，甚至推出了一个全新的开发平台 Google Antigravity。

它不再是帮你写几行代码，它是直接帮你“造产品”。无论你是想做个 APP，还是分析复杂的学术论文，甚至把枯燥的代码转化为可视化的图表，它都能搞定。

03. 深度思考：Deep Think 模式

还记得 OpenAI 的 o1 吗？谷歌这次也拿出了杀手锏——Gemini 3 Deep Think。

这是一个增强推理模式，专门用来解决那些让人头秃的复杂问题（数学、科学、复杂代码）。在 GPQA Diamond 测试中，它拿下了 93.8% 的恐怖分数。

更强的是它的多模态能力。比如你想学做菜，直接把一张手写的外语食谱照片扔给它，它不仅翻译，还能根据你的口味调整；甚至你把打匹克球的视频发给它，它能像专业教练一样分析你的动作，制定训练计划。

04. 多模态不是"能看图"而已，它要"活在你的世界"

现在哪个模型不能看图啊？但Gemini 3的多模态让我觉得毛骨悚然的是——它不是在"处理"你的输入，它是在"进入"你的生活。

官方举的例子很有意思：

翻译你奶奶的手写菜谱：这不仅是OCR+翻译。不同语言、手写体、家族传承的烹饪逻辑、甚至食材的地域替代，这些看似简单的任务其实需要文化理解+空间推理+常识+情感价值判断。Gemini 3能搞定，说明它抓住了"菜谱"背后的语境。

分析你的匹克球视频：更狠。它要看懂视频（时序理解），识别你的动作（姿态估计），找出技术缺陷（专业判断），制定训练计划（目标拆解）。这不是"看图说话"，这是当私人教练。

百万token上下文：你可以塞给它一整门课程的讲义+视频+论文，它给你生成交互式记忆卡片。这不是搜索+总结，这是替你学完一整门课，然后按你的认知风格重新教你一遍。

多模态的真正价值，不是让AI多几种输入方式，而是让它能"活"在你真实世界的信息流里。你的文档、你的照片、你拍的视频、你听的播客，这些过去分散在各处的信息，现在能被一个"数字大脑"统一理解。这等于在你的生活里安插了一个全天候的"第二大脑"。

AI 的“直觉”时代来了

Gemini 3 的发布，给我最大的感受不仅仅是跑分的提升，而是AI 交互方式的质变。

从 Gemini 1.0 的“读懂文字”，到 Gemini 3 的“读懂氛围”和“深度思考”，谷歌正在让 AI 具备类似人类的直觉和自主性。

它已经被集成到了 VS Code (Cursor), GitHub, Replit 等所有开发者熟悉的工具中。这意味着，从今天起，我们的生产力工具不仅有了大脑，还有了“灵魂”。

Gemini 3很强，强到让我这个AI博主有点心慌。它不只是参数大、分数高，它开始理解语境、进入场景、接管流程。

但问题来了：

当AI能答对41%的"人类最后考试"，我们还需要培养博士吗？

当AI能看懂你奶奶的菜谱，我们还需要传承记忆吗？

当AI能替你写代码、做决策、规划人生，"人"的价值在哪里？

Google在发布会上说"迈向通用人工智能的一大步"，但AGI的真正考验不是它多聪明，而是人类如何与这种聪明共处。

Gemini 3不是终点，它是人机关系新纪元的起点。我们需要的不是更强的AI，而是更强的"人+AI"协作智慧。技术已经跑在前面了，现在该轮到我们思考——如何让这个强大的工具，服务于人性的光辉，而不是消解人的意义。

最后问大家一个问题：

面对越来越“懂你”甚至懂你“潜台词”的 Gemini 3，你会选择抛弃现在的 GPT 或 Claude 吗？

更多transformer，VIT，swin tranformer
参考头条号：人工智能研究所
v号：人工智能研究Suo, 启示AI科技

动画详解transformer 在线视频教程

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI提效指南：Nano Banana 生成精美PPT与漫画

2048 AI社区

【AI课程领学】第四课1/3：CNN 基本组件与操作——卷积/步幅/填充/池化/归一化/激活/感受野（含 PyTorch + NumPy）

2048 AI社区

【GitHub开源AI精选】DeepEyesV2：迈向多模态智能体的新里程碑

2048 AI社区

所有评论(0)

查看更多评论

人工智能研究所

@weixin_44782294

已为社区贡献21条内容