2025年9月第1周AI资讯
本周AI领域热点速览:1)Nanobanana图像编辑模型走红,支持证件照制作、设计图渲染等功能;2)Google发布Gemini 2.5 Flash提示词指南,助力用户提升图像生成质量;3)Rork无代码开发App上线iOS平台,支持自然语言快速生成应用;4)马斯克xAI推出Grok Code Fast 1编程模型,具备高性能低价格优势;5)腾讯发布AudioStory音频生成模型,可自动生成叙
今天为大家总结近一周值得关注的 AI 新闻:
Nanobanana 模型自发布以来迅速走红,成为 AI 图像处理领域的明星工具。用户只需登录 Google AI Studio,选择 Nanobanana 模型,上传一张或多张图像,并输入提示词,就能完成高质量的图像编辑。
其主要玩法包括:
- 证件照制作:上传包含人脸的图像,输入提示词如“证件照、白底、职业正装”,即可生成逼真的两寸证件照,还能生成结婚照、工作照等多种样式。
- 设计图渲染:只需上传手绘草稿,系统即可生成高质量渲染图,广泛适用于建筑、产品、UI 等领域。
凭借这些功能,Nanobanana 被认为是提升创作效率的利器。
为了帮助用户更好地发挥模型的潜力,Google 官方发布了 “Gemini 2.5 Flash 提示词指南”。该指南详细解释了提示词的编写方法,内容涵盖了 文本提示、参考案例、提示词模版 等实用模块。
无论是初学者还是进阶用户,都能借助这份指南快速掌握高效的提示词使用方法。它不仅能帮助用户提高图像生成的精度,还能显著提升图像风格与排版的可控性。有兴趣的朋友,可以点击连接查阅完整内容。
这份指南被认为是 入门 Nanobanana 的最佳伴侣,为用户打开了 AI 图像创作的大门。
本周,一款名为 Rork 的 iOS 应用引发关注。它的核心亮点是 支持无代码开发,用户只需通过自然语言输入需求,就能快速生成 App,并且可以直接发布到 App Store。
其主要功能包括:
- 输入简单的指令即可完成应用开发,例如“生成一个连连看游戏”;
- 生成后可直接试玩,体验效果直观;
- 如果需要修改功能,只需继续输入新的指令即可完成迭代。
目前 Rork 已经向用户 限时免费开放两周,不少开发者和个人用户都在用它尝试新玩法,甚至有一些基于 Rork 制作的应用已经成功上架苹果应用商店。这款应用被认为是 移动端无代码开发的新突破。
4. Musk 推出 Grok Code Fast 1编程模型
马斯克旗下的 xAI 正式发布了智能编程模型Grok Code Fast 1,被视为 AI 编程领域的一大进展。
它的主要特点包括:
- 性能优势:速度更快,支持长达 256k 的上下文能力;
- 价格优势:输入仅 0.2 美元 / 百万 Token,输出仅 1.5 美元 / 百万 Token,远低于同类模型;
- 能力表现:官方称其具备 GPT-5 级别的编程能力,但价格仅为 1/10;
- 应用范围:目前已在 Cursor、GitHub Copilot 等主流平台开放限时免费试用。
这一模型为开发者提供了 高性能、低成本 的新选择,也有望推动编程自动化的发展。
腾讯最新推出的 AudioStory 模型,让长篇音频叙事内容的生成变得更加高效。用户只需输入文本或视频片段,就能自动生成完整的背景音乐和配套的叙事音频。
应用场景包括:
- 有声小说制作:快速生成人物对白和背景音效;
- 动画配乐:帮助动画创作者完成叙事配音与氛围音乐;
- 游戏场景音乐:支持自动化生成背景音乐,提升沉浸体验。
据实测,AudioStory 在自然场景和卡通风格的音频生成中均优于同类模型,被业界视为 AI 音频生成的新标杆,未来在文娱产业中具有广阔的应用空间。
本周, Higgsfiled推出了一个有趣的新功能:Excel 上线的 GTAI 应用。用户只需上传一张人物图像,系统就能自动生成 GTA V 游戏中的经典场景画面。
例如:上传一张自拍照,GTAI 就能将你“放进”抢车现场,效果真实又搞笑,非常适合制作 TikTok 和 B 站短视频。此外, Higgsfiled已经为所有付费用户开放 365 天不限次数使用权限,进一步降低了体验门槛。
这一玩法迅速在社交媒体上引发热议,被网友称为 “玩梗神器”,展示了 AI 在娱乐化创作领域的无限潜力。
更多推荐
所有评论(0)