家人们,众所周知,今天是 Gemini 3 上新的日子,AI 圈子简直是久旱逢甘霖。

谷歌 Gemini 3 这次不仅把模型能力拉到了新高度,还带来了两个极其性感的功能:

GenUI(生成式界面) 和 Vibe Coding(氛围编码)。

但是 Gemini 3 刚上线就被限流限得死死的,pro 用户一天也没几条额度,纷纷吐槽遭谷歌限额。

但最有意思的一件事儿是什么?

就在谷歌画饼明年推出 AI Studio 移动版来支持手机端编程的时候,咱们国内昨天也端上来一个叫“灵光”的 App,已经干这个事儿了。。。。

我连夜肝了两个通宵,左手 Gemini 3,右手灵光。建议用不上 gemini 3 的宝宝们,可以去试试灵光,解解馋 ~

我对比了一下功能,这俩 AI,居然有些地方撞车了。

首先是 Gemini 3 的 GenUI,就是 AI 不光给你文字答案,还能根据需求生成交互界面。比如在谷歌演示里,你搜 RNA 聚合酶,它直接生成一个可交互的 3D 分子模型。你问股票数据,它直接给你渲染个图表,你问建筑长啥样,它给你个 3D 模型。

这个思路的核心是,让信息被高效地组织,以最直观的形式呈现。

灵光在做的事情,几乎一模一样。

它的产品介绍里说得很直白,蚂蚁集团推出的全模态通用 AI 助手,可以输出 3D 数字模型、音视频、图表、动画、地图等多种模态的结果。

我实测了下,确实如此。一句话能快速生成一个多模态、可交互的动态网页。

比如我问它:

讲一下黑洞的原理

他不仅给我输出结构化的易于理解的知识,还将黑洞的形成原理用动画展现出来。这种信息密度和理解效率,就比纯文字高太多了。

比如我再问“介绍一下越王勾践剑”或者“悉尼歌剧院”,它不是给你发图片,而是直接甩给你一个 3D 模型 :

你可以在手机屏幕上 360 度旋转它,把玩它。

Gemini 3 也强调全模态——文本 + 图像 + 音频 + 视频,所以这俩 AI 在多模态输出方面趋同。

当然,技术实现的底层肯定不一样,精细度也有差距。但对于普通用户来说,能用到的效果, 已经很接近了。

Gemini 3 的 GenUI 目前更多还是在搜索场景展示,而灵光把这套逻辑塞进了 App 的每一次对话里。反而我觉得灵光,更接地气,门槛更低,因为现在你就可以直接在手机端 安卓 +iOS 下载使用了。

Vibe Coding vs 闪应用:都在降低"创造"的门槛

Gemini 3 最让我兴奋的概念是 Vibe Coding。你不需要懂代码,只需要有“直觉”,AI 就能帮你写程序。但谷歌目前的方案(Google Antigravity)还是偏向桌面的、偏向开发者的 IDE 环境 。

蚂蚁灵光把相似的功能,也做到了 APP 里,场景更轻量级,适合日常脑子里突然冒出来一个小想法,小需求,但是又找不到现成的应用,就可以让 AI 给你手搓一个。

比如我突然想做个小工具,记录每天的心情变化,然后生成情绪曲线图。这个需求很简单,但对于不会编程的人来说,就是无解。

蚂蚁灵光里有一个功能叫——灵光闪应用,做的事情又是类似的,只不过是给普通用户在手机上随时随地用的。

比如,我跟灵光说:

帮我做一个可以记录热量的用于减肥的应用

不到一分钟,一个带 UI、带逻辑的热量计算器就出来了,而且还内置了一些常见食材的热量。

对于我这种有点“迷信”的人,我想要一个特殊的日历:

做一个包含禅意、塔罗牌、农历、黄历、星座的 N 合一日历

灵光立刻给我做成了。

我甚至没有清晰的产品文档,我只有一个模糊的念头,灵光捕捉到了这个念头,并把它变成了现实。

而且,这应用不是一次性的对话流,不是阅后即焚的玩具,你可以将生成的应用直接保存下来下次直接用,真正变成了你手机里随时待命的专属 生活小应用。

除了上面两个和 Gemini 3"撞车"的功能,灵光还有个我觉得挺实用的能力:灵光开眼

简单说就是实时视觉理解。它不再是简单的扫一扫,而是能实时理解你眼前的物理世界。遇到不懂的公式、看不懂的外文小票,或者路边不认识的花花草草,你直接举起手机,立刻丝滑给你讲解:

这种“所见即所知”的感觉,让原本枯燥的现实世界变得生动起来。

测完灵光和 Gemini 3(虽然后者我大部分时间在排队),我有几点真实感受。

最大的一点感受是,国产 AI 跑的挺快的。

谷歌说明年会有移动版的开发工具 ,而蚂蚁灵光现在就已经上线了,尽管两者的终局构想或许殊途,但是移动优先这件事情上,中国厂商的嗅觉和执行力确实太快了。

如果你现在就想体验"动态界面"和"一句话生成应用"这类新玩法,但 Gemini 3 用不上或者被限流劝退了,那灵光是个可以立刻上手的选择

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐