Seedance 2.0 深度体验：从“抽卡“到“导演“，AI视频创作终于可控了

即梦Seedance 2.0低调上线，带来AI视频生成新突破。新版核心升级在于多模态参考能力，支持图片、视频、音频等多种素材组合输入，大幅提升生成可控性。测试显示，人物动作更连贯、物理规律更合理，能完成复杂叙事和镜头调度。用户可通过自然语言描述结合素材参考，实现精准创作。新版本还具备剧情补全、音色模仿等惊喜功能，解决了传统AI视频"抽卡式"生成的痛点。虽然偶有翻车，但2.0版本

thedreamofgirls

1197人浏览 · 2026-02-27 10:03:52

thedreamofgirls · 2026-02-27 10:03:52 发布

即梦Seedance 2.0悄悄上线了，我花了一天研究，聊聊真实感受

最近即梦更新了Seedance 2.0，没发什么通稿，也没搞大阵仗，悄悄就上了。我是刷到别人发的视频才知道的，试了一天之后，觉得有必要认真聊聊这次升级。
在这里插入图片描述

打开之后选"视频生成"就能看到新版本，音频、视频、文字、图片都可以作为参考素材。

在这里插入图片描述

立即体验 Seedance 2.0！

先说最核心的变化：参考能力

之前用AI做视频，最大的痛点是什么？不可控。 你写了提示词，生成出来的东西跟你脑子里想的完全是两回事，基本靠运气。

2.0最大的改变就是解决了这个问题。它的参考能力做了一次质的提升——你可以给它一张图，让它还原画面构图和角色细节；可以给它一段视频，让它学习里面的镜头语言、动作节奏甚至特效风格；还可以给它一段音频，让它把握整体的节奏和氛围。

这些素材可以自由组合。也就是说，你完全可以用一张图确定画面风格，用一段视频指定角色动作和镜头变化，再用一段音频带起节奏——搭配提示词，你就是这条视频的导演，而不是一个抽卡的人。

基本功的进步比想象中大

先抛开那些花哨的玩法不谈，2.0在最基础的层面就有明显进步：物理规律更合理了，人物动作更连贯了，对提示词的理解也更准确了。

举个例子，我用一张女孩的图片，写了一段提示词：

女孩在优雅地晒衣服，晒完接着从桶里拿出另一件，用力抖一抖。

查看视频

生成出来的视频非常自然流畅，找不到任何卡顿和跳帧的地方。这在以前几乎不可能——稍微复杂一点的连续动作，以前的版本总会在某个地方崩掉。

还有一个更有意思的测试：我让画里的人物偷偷探出画框拿可乐喝，听到脚步声又慌张放回去，最后镜头推进到可乐特写，配上一句广告词。整个叙事链条、人物表演、镜头调度，全是模型自己完成的。 说实话看到成品的时候我是有点吃惊的。

【提示词】
画里面的人物心虚的表情，眼睛左右看了看探出画框，快速的将手伸出画框拿起可乐喝了一口，然后露出一脸满足的表情，这时传来脚步声，画中的人物赶紧将可乐放回原位，此时一位西部牛仔拿起杯子里的可乐走了，最后镜头前推画面慢慢变得纯黑背景只有顶光照耀的罐装可乐，画面最下方出现艺术感字幕和旁白：“宜口可乐，不可不尝！”

查看视频

多模态参考到底意味着什么

说白了就是一句话：你能往里面塞的素材类型变多了，模型能理解的东西也变多了。

文本、图片、视频、音频，这些素材都可以作为参考对象上传。你想参考某个视频的动作？可以。想参考某张图片的构图？可以。想让生成的角色用某段音频里的声线说话？也可以。

在这里插入图片描述

关键是，这些参考不需要你写什么专业术语，用自然语言描述清楚就行。比如"参考这段视频的运镜节奏，参考这张图的角色形象"，模型就能理解你要什么。

有一点要注意：素材多的时候，记得用@标注清楚每个素材的角色，比如"@图1为首帧"、“参考@视频1的动作”，别让模型搞混了。

以前做不好的事情，现在能做了

用AI做过视频的人应该都踩过这些坑：换个角度人脸就变了，动作跟参考完全对不上，视频想延长一点结果接缝明显，节奏跟预期差了十万八千里。

2.0把这些老问题基本都解决了。

我做了一个测试：把一段街拍视频里的女生替换成戏曲花旦，场景换到一个精美的舞台上，同时保留原视频的运镜和转场效果。生成出来之后，角色的一致性保持得非常好，转场也很流畅，不仔细看根本发现不了是AI生成的。

查看视频

几个实用的进阶技巧

实际使用中有几个场景你大概率会碰到，这里直接给出提示词的写法：

已经有首帧图，还想参考某个视频的动作： 在提示词里写清楚，比如"@图1为首帧，参考@视频1的打斗动作"。

想延长一个已有的视频： 提示词写"将@视频1延长5秒"，同时生成时长也要选5秒——注意，时长选的是新增部分的长度，不是总长度。

想在两段视频之间加一个过渡场景： 提示词写"在@视频1和@视频2之间加一个场景，内容为xxx"。

想生成连续的动作： 加入连续性描述，比如"角色从跳跃直接过渡到翻滚，保持动作连贯流畅"。

核心原则就一个：用大白话把你想要的效果讲明白。 不需要专业术语，模型的理解能力比你以为的要强。

创意和剧情补全能力是意外惊喜

这个版本有一个能力是我之前完全没预料到的——剧情补全。

我给它一张漫画分镜图加一段参考视频的风格，让它把静态漫画演绎成动态视频。结果它不仅做了分镜切换和音效，还自己补全了一些过渡情节，让整体叙事更流畅。成品看起来完全不像是拼凑出来的。
在这里插入图片描述

查看视频

音色方面也有惊喜。如果你不喜欢默认的配音，可以上传一段你喜欢的音频，提示词里写明"语气和音色参考@音频1"，生成的角色就会用那个声线说话。我试了一下，用这个功能做虚拟和现实结合的短剧效果特别好。

还有一些值得一提的升级

除了上面说的这些，2.0在高难度运镜的复刻、一镜到底的连贯性、音乐卡点、情绪演绎这些方面也都有明显提升。视频编辑功能的可用性也比之前高了不少，整体来说是一次很扎实的全面升级。

说点掏心窝的

AI视频工具我前前后后用了不少，大部分给我的感受都是"有意思但不实用"——生成出来的东西跟你想的不一样，改又改不动，最后只能当个玩具。

即梦这次的2.0给我的感觉不太一样。它第一次让我觉得，我是在"创作"而不是在"抽卡"。 图片定画面、视频定动作、音频定氛围、文字定剧情，每一步都有抓手，每一步都可控。

当然，它也不是完美的，复杂场景偶尔还是会翻车。但作为一个创作工具来说，2.0的完成度已经相当高了。

立即体验 Seedance 2.0！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

[Dify x EdgeOne] 论文猎手——用 Dify + EdgeOne Pages 给科研人造一个每日 arXiv 速读助手

2048 AI社区

[Dify x EdgeOne] 哄睡童话机——用 Dify + EdgeOne Pages 给娃造一个会现挂的 AI 睡前故事神器

2048 AI社区

openclaw v2026.5.28发布：Agent恢复更稳、渠道安全全面增强、移动端焕新、Provider能力再扩展

代码地址：github.com/openclaw/openclaw总体来看，并不是一次单点功能更新，而是一次覆盖运行时、渠道、安全、移动端、浏览器输入、Provider、文档处理、CLI、认证、插件性能、发布验证链路的综合性升级。Agent 与 Codex 运行时恢复更稳多渠道消息投递与会话身份更安全移动端、WebChat、Talk 等体验更连续浏览器和自动化输入校验更严格Provider、PDF