Perplexity AI 推出基于订阅制的视频生成服务

Perplexity AI[1] 在全平台推出视频生成功能。根据订阅等级不同,Pro 用户每月可创建 5 个视频,而 Max 用户则可享受每月 15 个视频的生成额度。从效果来看,这背后很可能采用了谷歌最新的 Veo 3 模型。

Pika AI 推出音频驱动视频生成模型

Pika 发布了音频驱动的视频生成模型,该模型能够以近乎实时的方式生成具有超真实表情的视频。该技术支持任意长度和风格的视频制作,并能在6秒或更短的时间内完成高清视频的生成。Pika表示,新模型在速度上提升了20倍,同时成本也大幅降低。

官方表示即将在 Pika social app 中推出。

智谱 AI 开源视觉推理旗舰 GLM-4.5V

智谱 AI 正式发布基于 MOE(混合专家)架构的新一代旗舰视觉推理模型GLM-4.5V[2],支持多模态输入,并在多个基准测试中达到SOTA性能,现已开源并提供 API 服务。

特别值得一提的是,该模型采用 1060 亿总参数设计,其中 120 亿为激活参数,是当前开源领域最强的视觉推理模型。

微软推出 Microsoft POML:专业级提示词编排标记语言

Microsoft POML(Prompt Orchestration Markup Language)[3]是微软最新发布的专门用于编排提示词的标记语言,有效解决了提示词工程中的四大痛点:结构化缺失、复杂数据整合困难、格式敏感性以及工具链不完善等问题。

微软还贴心地提供了 Node.js 和 Python 的 SDK。这个项目好,终于有人做了,可以用专门的格式来管理和维护提示词了

Vercel v0.dev → v0.app:AI Agent 模式一键生成全栈应用

Vercel 旗下的 v0.dev 现已正式更名为 v0.app[4],并上线了 Agent 模式。

这个 AI 项目构建器现在升级为通用解决方案,仅需一个提示词就能自动生成完整的全栈应用。完整变化可以看官方的公告,总之现在能够自动执行并规划任务了。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐