以为 AI 圈最近风平浪静?谷歌刚刚反手甩出一枚核弹。Gemini 3 正式发布,不挤牙膏,直接碾压。它不仅拿下了最强推理的皇冠,更带来了一个全新的概念——Vibe Coding(氛围编码)。谷歌这次,是真的杀疯了。Google DeepMind 的 CEO Demis Hassabis 悄悄按下了发射键:Gemini 3 来了。

图片

不是 PPT,不是画饼,是实打实的 Gemini 3 Pro 预览版,以及一个更神秘的 Gemini 3 Deep Think 模式。作为一个天天跟AI打交道的自媒体人,我见过太多"史上最强"的模型发布会。但看完Gemini 3的发布,我第一反应是:Google这次不只是在卷参数,它在悄悄改写人机关系的底层逻辑。这不是又一场性能榜单的军备竞赛,这是AI从"聪明工具"到"懂你伙伴"的跃迁。

图片

01. 霸榜第一:告别“车轱辘话”

先看硬指标。在 AI 圈最权威的竞技场 LMArena 上,Gemini 3 Pro 拿下了 1501 Elo 的历史最高分。

图片

什么概念?它不仅超过了之前的版本,更是在“人类最后的考试(Humanity's Last Exam)”中拿到了 37.5% 的高分(不使用工具)。

GPQA Diamond 91.9%:这是生物学、物理学、化学领域的大坑题集合。人类专家水平大概是65%,Gemini 3接近92%。我的天,它这是要抢教授的饭碗。

图片

但最让我觉得恐怖的是ARC-AGI-2的45.1%。这个测试测的是AI面对全新问题的适应力,不是背题库。之前的顶尖模型都在30%挣扎,Gemini 3 Deep Think直接捅破了天花板。这说明它开始具备真正的"举一反三"能力,而不是高级复读机。

这些数字背后,Google在传达一个信号:别比了,我让半个身位你们都追不上。

图片

但分高不代表好用。Gemini 3 最让我惊喜的,是谷歌终于改掉了 AI 最大的毛病——“说废话”。

官方明确表示,Gemini 3 的回复“摒弃了陈词滥调和奉承”。它不再是一个只会唯唯诺诺、说着“作为一个大语言模型...”的机器人,而是一个思想伙伴(Thought Partner)。它会直接给你深刻的见解,甚至是指正你的错误,告诉你“你需要听到的”,而不是“你想听到的”。

这才是 AI 进化的正确方向。我们需要的是一个敢于反驳、逻辑严密的智囊,而不是一个只会拍马屁的客服。

图片

02. 绝活登场:什么是 "Vibe Coding"?

这是本次发布会最性感的词:Vibe Coding(氛围编码)。

图片

以前写代码,你需要精准描述功能、逻辑、参数。但在 Gemini 3 面前,你可以说:“给我做一个类似赛博朋克风格的个人主页,感觉要酷,带点复古霓虹灯的调调。”

图片

Gemini 3 就能捕捉这种模糊的 "Vibe"(氛围/感觉),直接生成可交互的 Web 界面。它在零样本生成方面表现极为出色,甚至推出了一个全新的开发平台 Google Antigravity。

图片

它不再是帮你写几行代码,它是直接帮你“造产品”。无论你是想做个 APP,还是分析复杂的学术论文,甚至把枯燥的代码转化为可视化的图表,它都能搞定。

03. 深度思考:Deep Think 模式

还记得 OpenAI 的 o1 吗?谷歌这次也拿出了杀手锏——Gemini 3 Deep Think。

图片

这是一个增强推理模式,专门用来解决那些让人头秃的复杂问题(数学、科学、复杂代码)。在 GPQA Diamond 测试中,它拿下了 93.8% 的恐怖分数。

更强的是它的多模态能力。比如你想学做菜,直接把一张手写的外语食谱照片扔给它,它不仅翻译,还能根据你的口味调整;甚至你把打匹克球的视频发给它,它能像专业教练一样分析你的动作,制定训练计划。

图片

04. 多模态不是"能看图"而已,它要"活在你的世界"

现在哪个模型不能看图啊?但Gemini 3的多模态让我觉得毛骨悚然的是——它不是在"处理"你的输入,它是在"进入"你的生活。

图片

官方举的例子很有意思:

翻译你奶奶的手写菜谱:这不仅是OCR+翻译。不同语言、手写体、家族传承的烹饪逻辑、甚至食材的地域替代,这些看似简单的任务其实需要文化理解+空间推理+常识+情感价值判断。Gemini 3能搞定,说明它抓住了"菜谱"背后的语境。

分析你的匹克球视频:更狠。它要看懂视频(时序理解),识别你的动作(姿态估计),找出技术缺陷(专业判断),制定训练计划(目标拆解)。这不是"看图说话",这是当私人教练。

百万token上下文:你可以塞给它一整门课程的讲义+视频+论文,它给你生成交互式记忆卡片。这不是搜索+总结,这是替你学完一整门课,然后按你的认知风格重新教你一遍。

图片

多模态的真正价值,不是让AI多几种输入方式,而是让它能"活"在你真实世界的信息流里。 你的文档、你的照片、你拍的视频、你听的播客,这些过去分散在各处的信息,现在能被一个"数字大脑"统一理解。这等于在你的生活里安插了一个全天候的"第二大脑"。

AI 的“直觉”时代来了

Gemini 3 的发布,给我最大的感受不仅仅是跑分的提升,而是AI 交互方式的质变。

从 Gemini 1.0 的“读懂文字”,到 Gemini 3 的“读懂氛围”和“深度思考”,谷歌正在让 AI 具备类似人类的直觉和自主性。

图片

它已经被集成到了 VS Code (Cursor), GitHub, Replit 等所有开发者熟悉的工具中。这意味着,从今天起,我们的生产力工具不仅有了大脑,还有了“灵魂”。

图片

Gemini 3很强,强到让我这个AI博主有点心慌。它不只是参数大、分数高,它开始理解语境、进入场景、接管流程。

但问题来了:

当AI能答对41%的"人类最后考试",我们还需要培养博士吗?

当AI能看懂你奶奶的菜谱,我们还需要传承记忆吗?

当AI能替你写代码、做决策、规划人生,"人"的价值在哪里?

图片

Google在发布会上说"迈向通用人工智能的一大步",但AGI的真正考验不是它多聪明,而是人类如何与这种聪明共处。

Gemini 3不是终点,它是人机关系新纪元的起点。 我们需要的不是更强的AI,而是更强的"人+AI"协作智慧。技术已经跑在前面了,现在该轮到我们思考——如何让这个强大的工具,服务于人性的光辉,而不是消解人的意义。

图片

最后问大家一个问题:

面对越来越“懂你”甚至懂你“潜台词”的 Gemini 3,你会选择抛弃现在的 GPT 或 Claude 吗?

更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技

 动画详解transformer  在线视频教程 

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐