谷歌(Google)这次是真的“急”了,但也真的“强”了。这几天科技圈最热的梗是什么?不是 OpenAI 又更新了什么模型,而是大家都在讨论一根“香蕉”——没错,就是谷歌刚刚发布的 Nano Banana Pro。

图片

你没听错,这个名字听起来像是在超市货架上卖的减肥代餐,或者是某种儿童玩具,但实际上,它是谷歌 DeepMind 团队刚刚扔向 AI 绘画界的一颗“核弹”。它的正式名称是 Gemini 3 Pro Image,但因为前代版本“Nano Banana”在网上爆火,大家更愿意叫它“Nano Banana Pro”。

图片

就在我准备吃瓜看热闹时,真正让我后背发凉的不是这张图有多逼真,而是它背后那个被所有人忽略的"隐藏彩蛋"——搜索增强功能。这哪是AI画图?这是Google在用自己的"基因武器"对整个创意产业降维打击。

图片

先思考再画画的"视觉大脑"

别以为这只是又一个Midjourney升级版。Nano Banana Pro的骚操作在于:它动笔前先过脑子。

传统AI画图就像个靠背题考上清华的学霸,喂什么学什么,但不知道牛顿定律为啥成立。Nano Banana Pro不一样,它内置了Gemini 3的"深度思考"模式,画图前先跑一轮物理模拟和逻辑推演。

图片

举个例子:你想画"哆啦A梦和李白对饮"。普通AI可能给你拼个四不像,但Nano Banana Pro会:

先理解"唐朝服饰"的结构逻辑

推演"月光下的光影关系"

模拟"石桌酒具的透视原理"

最后才下笔

它不是在匹配图像模式,而是在构建视觉逻辑。 这就是为什么它能同时保持5个角色的一致性,把14张图无缝融合——因为它真的"懂"了。

图片

作为一个每天都在和 AI 斗智斗勇的自媒体人,我第一时间上手体验了这款产品。用完之后,我只想说一句话:Midjourney 和 DALL-E 的好日子,可能真的要到头了。

为什么这么说?

图片

终于!AI 终于学会“写字”了!

玩过 AI 绘画的朋友都知道,以前我们想生成一张海报,最痛苦的是什么?是文字!你让 AI 画一个“写着 SALE 的商店招牌”,它往往会给你画出一堆看起来像外星文的鬼画符,或者是缺胳膊少腿的字母。

但是,Nano Banana Pro 把这个问题彻底解决了。

图片

在官方演示和我的实测中,你只需要告诉它:“生成一张复古咖啡馆海报,上面用花体字写着 'Morning Coffee $5'。” 啪!一张完美的海报就出来了,上面的字迹清晰、拼写正确,甚至连字体风格都完美契合画面。

图片

这不仅仅是“能写字”,这是“排版师”级别的审美。对于做电商、做运营的小伙伴来说,这简直是神技!以后做个促销海报,可能真的只需要一句话。

图片

它不仅有“手”,还有“脑子”

以前的 AI 绘图工具,更像是一个“只会画画的文盲”。你让它画“光合作用流程图”,它可能会画得很好看,但箭头乱指,科学原理全错。

图片

但 Nano Banana Pro 背后站着的是谷歌最新的 Gemini 3 Pro 大模型。这意味着什么?意味着它“懂知识”。

当你输入“画一张图解释雨是如何形成的”,它不会乱画,而是会根据谷歌搜索的庞大知识库,生成一张逻辑正确、标注清晰的科普图。它知道水蒸气上升、冷凝、降雨的正确顺序。

图片

这是降维打击。 当别家 AI 还在拼光影、拼细节的时候,谷歌的 AI 已经在拼智商了。

连续性:做漫画的神器

很多创作者想用 AI 画绘本或漫画,最大的痛点是“脸盲”。第一张图里主角是长发,第二张图里突然变成了短发,或者衣服换了颜色。

Nano Banana Pro 引入了一个叫“强一致性(Strong Identity Control)”的功能。你上传几张参考图,或者设定好一个角色,它就能在后续的生成中,死死地“记住”这个人的长相。

图片

你想让同一个角色在咖啡厅喝水、在操场跑步、在太空漫步?没问题,脸还是那张脸,衣服还是那件衣服。这对于想做自媒体IP、画连载漫画的人来说,简直是史诗级的加强。

图片

编辑图片,像聊天一样简单

以前如果你觉得 AI 生成的图左下角有个杯子很多余,你可能需要用 PS 的修补工具涂半天,或者用复杂的重绘(Inpainting)功能。

图片

在 Nano Banana Pro 里,你只需要对着图片说:“把左下角的杯子移走”,或者“把背景的白天改成日落”。

图片

它真的能听懂!它不是重新生成一张图,而是精准地修改你指定的地方。这种“指哪打哪”的操控感,让人感觉自己不是在操作软件,而是在指挥一个高级美工。

图片

真正的杀招:Google用搜索给你"降维打击"

Nano Banana Pro最恐怖的功能叫Grounding with Search(搜索增强)。简单说就是:它画图时能实时联网查资料。

你想做个"广州两日游攻略图"?它不会瞎编,而是:

先搜广州最新景点信息

抓取实时天气数据

调取地图API

再把所有信息设计成精美的信息图

搜索是Google的"左脑",图像生成是"右脑"。 当左右脑一起工作,AI就从"画图工具"升级成了"视觉化知识引擎"。

图片

这意味着什么?意味着:

做PPT的不用再搜图+PS+排版,一句话搞定

做运营海报的不用愁素材和文案,AI自动配

做教学课件的可以直接把知识点可视化

Google在用搜索的基因,把AI画图从"艺术创作"降维成"信息表达"。 这一步,OpenAI想学都学不来。

图片

谷歌的“反击战”

说实话,过去两年,谷歌在 AI 领域给人的印象总是慢半拍,被 OpenAI 压着打。但这次 Nano Banana Pro 的发布,让我看到了谷歌恐怖的技术底蕴。

它没有去卷什么“艺术性”(虽然它的画质已经是 4K 电影级的了),而是精准地解决了用户的痛点:

文字乱码?解决了。

逻辑错误?解决了。

角色脸盲?解决了。

这才是成熟的产品,这才是我们可以真正用来“干活”的工具。

图片

虽然名字叫“香蕉”,但谷歌这次绝不是在“耍猴”。

如果你是设计师、自媒体人,或者是需要经常做 PPT、海报的职场人,我强烈建议你去试一试 Nano Banana Pro。它目前已经集成在 Google Workspace 和 Gemini App 里了。

千万别因为名字滑稽就小看它,这根“香蕉”,可能会滑倒所有的竞争对手。

 动画详解transformer  在线视频教程 

更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐