在这里插入图片描述

8月底Nano Banana爆火,那几天每天都可以看到相关的内容和新奇玩法,比较出圈的就是做手办图。看下来我觉得有点东西,自己也第一时间在Google AI Studio上做了尝试,确实也给了我惊喜。记得上一次给到我惊喜的还是GPT-4o,当时觉得通过提示词P图,可以很好的遵循指令,风格一致还不错。

在这个中间,我自己也做了不少尝试,比如SD3.5LFLUX.1Gemini-2.0-flash-preview-imageGPT-4o等。各家平台也用了不少,可灵、即梦、Recraft,RoboNeo。总的来说文生图都还不错,效果越来越好。但是图生图这块就差了很多,最大的问题就是一致性。让他改东,但它同时也会改西,甚至改的面目全非。。。

玩法

这块许多大佬都有分享,我就不过多赘述了,我贴几个链接给大家参考:

图生视频

9月1号的时候在推上看到了歸藏老师分享的古风书法美女跳舞的AI视频,自己也照着提示自己复刻了一下。

整体的思路就是,通过Nano Banana的一致性,生成多张同一人物的不同姿势的AI图片,这些AI图片用Kling 2.1的首尾帧功能两两生成5s的视频,最后多段视频拼接起来。

最终效果:

AI 兰亭集序

这里有个小问题,因为我生图时只使用了人物的上半身,所以人物服装会有略微的变化。我自己做的比较粗糙,后面老师也分享了详细的做法:量大管饱!让藏师傅疯狂涨粉的 Nano Banana 玩法合集 02,有兴趣的可以按老师的方法来操作。

试想一下,如果一致性不行,那么每次生成的图片人物差距过大,这样做出来的视频整体也不自然。higgsfield上有许多创意玩法,其实不少都是需要基于很好的一致性才能实现。下面这个视频就是用这张图片在higgsfield生成的。

在这里插入图片描述

higgsfield 3d-figure

Seedream 4.0

最近,字节发布了Seedream 4.0,对标的就是Nano Banana。之前Nano Banana的玩法,在Seedream 4.0一样可以很好实现。甚至对中文支持会更好。

我自己结合以前的测试用例,也测试了Seedream 4.0。结论就是一致性效果稍逊于Nano Banana,但整体来说已经是强的可怕了。

比如其中一个测试用例就是将地图中的运动轨迹想象成一种动物或者植物,这个动物或者植物的图形覆盖在地图的轨迹上,地图要求不做任何变化。这个实现难点就是地图部分,地图上面路径错综复杂,并且是真实路径,一旦被修改,哪怕是小小的变动,这个地图就已经失真了。

在这里插入图片描述

测试了几次,抛开审美,发现Seedream 4.0上每次地图都被或多或少的修改了。而Nano Banana相对更稳定,变化很少,或是看不出来。

我挑了效果类似的两张图,下图1是Nano Banana,图2是Seedream 4.0

Nano Banana
Seedream 4.0

但是也别小瞧Seedream 4.0,其他的模型相比它差距很大。并且在我的个别测试中,一致性也有胜过Nano Banana的。另外它是支持生4K图的模型,分辨率这块Nano Banana就弱了,而且对于中文的支持会更好。

所以整体互有胜负,我们追赶的脚步也越来越快了。我忘记在哪里看到过一个评论:远方的香蕉悦口,故乡的豆包暖心。

对比免不了,但是这只是为了搞清楚它们各自的优势,实际场景中,我们按需使用,它们都是让我们更强大的工具。另外说句题外话,RoboNeo是我目前发现在图片编辑上也很不错的工具,尤其是AI扩图,有兴趣的可以体验体验。


AI发展的太快了,感觉头疼了半年一年的问题,随着一个模型的发布,就迎刃而解了。体验了许多AI产品,经常被他们的效果和创意折服。

AI真是让人兴奋~

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐