“创意是智力活儿,也是体力活儿,归根结底是苦力活儿” —— 李诞

前言:当脱口秀遇见AI视频生成

2024-2025年,AI视频生成技术迎来了爆发式增长。字节跳动推出的SeeDance 2.0(也称Seedance 2.0)作为多模态AI视频生成模型的代表,正在重塑内容创作的边界。这款支持文本、图片、视频、音频四种模态输入的工具,能够生成长达15秒的高质量视频,并自带音效和配乐,被誉为"一个听得懂自然语言的AI导演助手"。

但技术再先进,脱口秀的本质从未改变——它依然是一份需要调动你全部人生的工作,依然需要逐字稿的锤炼,依然需要真诚的价值观表达。正如李诞在《脱口秀工作手册》中反复强调的:“这是一份工作”

本教程将深度融合李诞的创作方法论与SeeDance 2.0的技术特性,带你走完从创意到成片的完整流程。这不是一篇简单的工具说明书,而是一份AI时代的脱口秀创作工作手册


第一章:认知篇——首先,这是一份工作

1.1 理解SeeDance 2.0的本质:降低交易成本

李诞在手册开篇就指出:“工作的本质是交易,我们在用自己的时间和才能,通过一家公司,与市场交换金钱。” 这个经济学视角同样适用于理解AI工具的价值。

什么是SeeDance 2.0降低的交易成本?

在没有AI视频工具之前,如果你想制作一段30秒的脱口秀现场视频,可能需要:

  • 租赁场地和设备(成本数千元)
  • 组织观众和演员(时间成本极高)
  • 后期剪辑和调色(专业技术门槛)
  • 音效设计和字幕制作(额外人力成本)

SeeDance 2.0将这些成本压缩到了极致。根据官方数据,它能在3-5分钟内完成视频生成,理解复杂创意描述的准确率达到85%以上。这意味着,你可以用一杯咖啡的时间,完成过去需要一周筹备的制作

但请记住李诞的警告:“当你跟公司交易,比你直接跟市场交易还费劲时,你就可以离开这家公司过更好的生活了。” 如果SeeDance 2.0的生成结果总是偏离你的创意意图,不要迷信技术,换工具或回归传统方式都是理性的选择

1.2 AI时代的"逐字稿"思维

李诞在手册第3章强调:“请写逐字稿。文字只是索引,是你表演的目录,只是第一层。” 这个理念在AI视频创作中同样关键。

SeeDance 2.0的"逐字稿"就是你的提示词(Prompt)。

很多新手犯的错误是:把AI当成"许愿池",输入模糊的想法,期待魔法发生。这就像脱口秀演员上台前不写稿,指望"现场发挥"——结果往往是灾难性的。

根据SeeDance 2.0的最佳实践,一个专业的提示词应该包含:

主体 + 动作 + 场景 + 光影 + 镜头语言 + 风格 + 画质 + 约束

这与李诞要求的"把字词删到不能再删"异曲同工。每一个词都必须服务于最终的表演效果

1.3 真诚是第一位的——AI无法替代的核心

李诞在手册第7章写道:“表演的目的始终是让人相信。真诚是第一位的。脱口秀就是在演自己。”

这是本教程最重要的前提:SeeDance 2.0可以帮你生成画面,但无法替你表达价值观。AI可以模拟一个演员在舞台上的动作、表情、甚至口型同步(官方宣称唇形同步准确率达90%+),但它无法模拟你独特的人生体验和观察视角

在使用SeeDance 2.0之前,请先问自己:

  • 这个段子反映了我真实的价值观吗?
  • 这是我真正想表达的东西,还是为了追热点而硬凑的?
  • 如果AI生成失败了,我还能用文字或现场表演让它好笑吗?

只有先成为合格的脱口秀创作者,才能成为合格的AI视频导演。


第二章:准备篇——徒劳的准备与有意义的失败

2.1 工作流设计:全能参考模式的核心逻辑

SeeDance 2.0提供两种主要工作模式:

模式 适用场景 李诞方法论对应
首尾帧模式 单张图片+文字,快速生成 开放麦试段子
全能参考模式 多模态混合输入,精准控制 读稿会+正式演出

根据你提供的附录建议,脱口秀视频制作强烈推荐"全能参考模式"。这与李诞强调的"以赛代练"逻辑一致——先用低成本方式验证创意(生成参考素材),再投入正式制作(最终视频生成)。

推荐工作流:

第一步:生成角色形象图(固定演员人设)
    ↓
第二步:生成/录制带台词的音频(确定节奏和包袱点)
    ↓
第三步:用全能参考模式合成最终视频(多模态精准控制)

2.2 演员人设的"逐字稿"——角色固定提示词

李诞说:“创作是一份调动你一切人生的工作。” 在AI视频制作中,"调动一切"的第一步是固定你的数字演员

根据你提供的附录,脱口秀视频的演员人设需要包含:

基础属性模板:

演员/人设:[性别年龄气质]+[服装固定]+[手持麦克风]

示例:
"一位28岁女性脱口秀演员,干练短发,穿黑色高领毛衣配牛仔裤,
手持银色手持麦克风,表情自信略带调侃,站立在小剧场舞台上"

SeeDance 2.0角色一致性技巧:

  1. 首帧图锁定:使用AI绘画工具(如Midjourney、即梦AI)先生成演员的标准形象图,作为@首帧素材
  2. 多视角参考:准备正面、侧面、45度角三张参考图,在提示词中指定"@图1为正面参考,@图2为侧面参考"
  3. 约束词必备:每次提示词必须包含"同一角色、服装一致、发型不变、面部稳定不变形"

避坑指南:

  • 避免"年轻漂亮女生"这类模糊描述,具体到"单眼皮、左脸颊有痣、戴圆框眼镜"
  • 服装避免复杂图案,纯色或简单纹理更容易保持一致性
  • 手持麦克风是重要锚点,必须在所有参考图中保持一致

2.3 舞台场景的"情境还原"

李诞在手册中反复强调"情境还原"的重要性:“把你要说的情境还原在眼前。让听你说话的人仿佛看到了一样。”

脱口秀场景的SeeDance 2.0描述模板:

场景:小型脱口秀剧场/Open Mic酒吧
背景:深红色天鹅绒幕布,隐约可见"开放麦"字样
灯光:追光灯(直径约1.5米暖白光)打在演员身上
观众区:昏暗轮廓,可见5-8排观众剪影,面部细节模糊
氛围:轻松、期待、略带紧张感

关键参数设置:

  • 比例:9:16(竖屏,适合抖音/小红书/视频号)
  • 时长:30-60秒(对应脱口秀一个完整段子)
  • 分辨率:调试阶段用1080P,最终输出用2K

2.4 音频素材的"节奏"准备

李诞用整整一节讨论"到底什么是节奏"。在AI视频中,节奏首先来自音频

推荐音频制作方案:

方案 工具 适用场景 李诞式评价
真人录音 手机+剪映 个人创作者,有表演能力 “真诚是第一位的”——最优解
AI配音 ElevenLabs/字节跳动语音合成 需要特定音色或方言 “取法其上得其中”——可用
混合方案 真人录台词+AI生成音效 追求电影感质感 “徒劳的准备”——但值得

音频节奏标记:
在音频波形图上标记以下节点,这些将成为SeeDance 2.0视频生成的关键帧:

  • 0秒:开场亮相
  • 包袱前0.5秒:停顿点(演员表情微妙变化)
  • 包袱点:台词高潮
  • 包袱后1秒:等笑(演员与观众互动)
  • 结尾:收束姿态

第三章:创作篇——如何开始:是洞察还是负面情绪?

3.1 从主题到提示词:梁左式创作法

李诞在手册第4章分享了梁左的创作方法:“每天要写剧本前,随便翻开成语词典的一页,挑一个成语,读完这个成语的释义,以此为主题出发,开始写作。”

这种**“限制激发创意”**的方法,完美适用于SeeDance 2.0提示词写作。

脱口秀视频主题生成练习:

  1. 随机选择一个你生活中的"负面情绪":地铁拥挤、外卖迟到、被催婚…
  2. 将其转化为具体场景描述
  3. 用SeeDance 2.0的"分镜思维"拆解为时间线

示例:主题"地铁早高峰"

0-5秒:全景,演员站在舞台中央,手持麦克风,表情无奈
"大家有没有发现,地铁早高峰是一场大型人类压缩实验..."

5-15秒:中景,演员模仿被挤压的姿势,表情夸张
"我昨天被一个大哥的公文包顶着腰,顶了八站地..."

15-25秒:特写,演员突然压低声音,神秘表情
"最可怕的是,我发现那个包里...装的是瑜伽垫"

25-30秒:中景,演员摊手,观众笑声中微微鞠躬
"他可能是想让我帮他练核心吧"

3.2 提示词工程:脱口秀专用的"逐字稿"

基于你提供的附录和李诞方法论,我总结出一套脱口秀视频专用提示词骨架

【基础版】单镜头脱口秀提示词

一位[性别年龄]脱口秀演员,[外貌特征],穿[服装描述],
手持[麦克风描述],站在[舞台场景]中。

表演内容:[台词内容或情绪描述]
动作:[自然手势描述],走位范围小,[具体动作1],[具体动作2]
表情:[整体表情基调],包袱前停顿0.5秒表情[微妙变化描述],
      包袱后等笑1秒,表情[得意/无奈/无辜等]

镜头:主机位中景稳定,[可选:包袱处切一次特写]
声音:现场近讲麦克风,轻混响,[观众笑声强度]
字幕:分行短句,关键词高亮,下三分之一位置

风格:写实/电影感,暖色调,质感真实
约束:面部稳定不变形,手指正常不扭曲,麦克风不变形,
      观众轮廓正常不扭曲,无闪烁跳帧,无过度滤镜

【进阶版】多镜头分镜提示词

@演员图1 作为首帧固定形象

0-8秒:中景稳定,演员站立舞台中央,手持麦克风,
       讲述开场白,自然手势配合,表情轻松自信,
       追光灯暖白,背景幕布深红,观众昏暗轮廓

8-18秒:镜头缓慢推近至中近景,演员身体微前倾,
        讲述主体内容,手势幅度略大,表情逐渐夸张,
        在[具体台词]处停顿0.5秒,眼神与观众交流

18-25秒:切特写,演员面部,讲述包袱部分,
         表情从[状态A]突变至[状态B],嘴角微扬,
         等待反应1秒,然后自然微笑

25-30秒:拉回中景,演员微微鞠躬/摊手,
         观众笑声中保持礼貌姿态,灯光渐暗

全程:字幕分行显示,关键词黄色高亮,
      音质清晰,轻混响,观众笑声只在包袱后出现

3.3 李诞式"删到不能再删"——提示词优化

李诞要求:“请仔细检查你的稿子,遵循一个基本的原则:把字词删到不能再删。”

SeeDance 2.0提示词同样需要这种极简主义。根据官方建议,提示词长度以80-200字为宜,且必须放弃"负面提示词"(如"不要模糊"),转为正向约束(如"画面清晰锐利")。

优化前后对比:

冗长版(不推荐) 精简版(推荐)
“请不要让演员的脸变形,不要有奇怪的表情,背景不要太亮,镜头不要晃动…” “面部稳定不变形,表情自然,背景昏暗,镜头固定”
“演员要讲一个关于上班的段子,内容很搞笑,观众会笑,演员自己也要笑…” “讲述职场段子,包袱后等笑1秒,表情得意”

关键技巧:

  • 动词代替形容词:“缓慢推镜"而非"温柔的镜头”
  • 数据代替感觉:“停顿0.5秒"而非"稍作停顿”
  • 约束词兜底:“不僵硬不变形不扭曲”

第四章:制作篇——请写逐字稿(技术实现)

4.1 第一步:生成演员形象图

工具选择:即梦AI、Midjourney、Stable Diffusion

李诞式工作标准:“这是一份工作,你是专业的,就不要干业余的人也能轻易做到的事。”

专业级形象图提示词:

A 28-year-old Chinese female stand-up comedian, 
short干练 hair, single eyelid, left cheek mole,
wearing black turtleneck sweater and blue jeans,
holding silver Shure SM58 microphone,
confident expression with slight smirk,
standing on small theater stage,
warm spotlight from top-left,
dark red velvet curtain background,
audience silhouettes in darkness,
cinematic lighting, realistic texture,
4K, highly detailed, professional portrait
--ar 9:16 --v 6

生成标准 checklist:

  • 面部特征清晰可辨识(用于后续一致性)
  • 手持麦克风角度自然
  • 服装简洁无复杂图案
  • 背景符合小剧场氛围
  • 光线方向明确(后续视频需保持一致)

生成3-5个版本,选择最符合"人设气质"的一张作为@首帧素材。

4.2 第二步:制作带台词的音频

方案A:真人录音(推荐)

设备:手机+耳机麦克风 或 USB电容麦
软件:剪映、Adobe Audition、GarageBand

李诞式录音标准

  1. 先写逐字稿——不是大纲,是每一个字
  2. 预演表演——对着手机前置摄像头录一遍,看表情和节奏
  3. 分段录制——按"开场-主体-包袱-结尾"分段,便于后期调整
  4. 标记停顿——在稿子中标注"/“表示0.5秒停顿,”//"表示1秒等笑

方案B:AI语音合成

工具:ElevenLabs、字节跳动语音合成、微软Azure语音

适合场景

  • 需要特定音色(如模仿知名演员风格)
  • 需要方言或外语
  • 深夜创作不便录音

避坑指南

  • AI语音的"包袱感"往往不足,需要手动调整语速和停顿
  • 建议在AI生成后,用真人录制"笑声反应"作为叠加层

4.3 第三步:全能参考模式合成(核心步骤)

这是SeeDance 2.0最强大的功能,也是本教程的核心。

操作界面:即梦AI → 视频生成 → 选择"Seedance 2.0" → 模式选择"全能参考"

素材上传清单:

素材类型 数量 命名建议 用途
演员形象图 1-3张 @Actor_Front, @Actor_Side 固定角色形象
场景参考图 1-2张 @Stage_BG, @Audience 锁定舞台氛围
运镜参考视频 1段 @Camera_Move 模仿专业运镜
音频文件 1段 @Audio_Main 对口型和节奏
笑声/音效 1段 @SFX_Laugh 增强现场感

全能参考模式提示词模板:

以@Actor_Front为人物形象固定参考,@Stage_BG为场景参考,
完全参考@Camera_Move的运镜节奏和镜头语言,
配合@Audio_Main的台词节奏进行口型同步,
@SFX_Laugh在包袱点后自然融入。

0-8秒:中景,演员站立,讲述开场,自然手势,
       镜头轻微环绕,表情轻松

8-18秒:推近至中近景,讲述主体,手势配合,
        在[台词标记处]停顿0.5秒,眼神交流

18-25秒:特写,讲述包袱,表情夸张变化,
         停顿等笑,@SFX_Laugh切入

25-30秒:回中景,收束姿态,微微鞠躬,
         灯光渐暗,观众掌声

风格:电影级写实,暖色调,追光效果,
      4K高清,面部稳定不变形,动作自然流畅

关键参数设置:

  • 时长:根据音频长度选择(建议30-60秒)
  • 比例:9:16(竖屏)
  • 分辨率:首次生成选1080P(节省积分),确认效果后生成2K版
  • 生成数量:一次生成2-4个变体,选择最佳

4.4 第四步:迭代优化——“以赛代练”

李诞强调:“以赛代练,错得够多了,自然就会了。” SeeDance 2.0的生成同样需要这种快速迭代思维。

迭代检查清单:

检查项 合格标准 常见问题 解决方案
面部一致性 与首帧图相似度>90% 五官漂移、表情僵硬 增加"@Actor_Front权重",添加"面部稳定不变形"约束
口型同步 主要发音口型匹配 口型滞后或超前 调整音频@标记位置,或分段生成后拼接
手势自然度 符合真人表演习惯 手指扭曲、动作僵硬 简化手势描述,添加"手势自然不夸张"
包袱节奏 停顿和等笑时机准确 节奏拖沓或过快 在提示词中明确标注"0.5秒停顿"“1秒等笑”
观众反应 笑声在正确时机出现 笑声过早或过晚 使用@SFX_Laugh精确控制,或后期添加
字幕安全区 不遮挡面部和麦克风 字幕位置过高/过低 添加"字幕下三分之一,不遮脸不遮麦"

迭代策略:
每次只修改一个变量。如果同时修改演员形象、运镜方式和音频,你永远不知道哪个调整起了作用。


第五章:表演篇——表演的目的始终是让人相信

5.1 “咬文嚼字”:语音象征主义在AI视频中的应用

李诞在手册中分享了"语音象征主义"的概念:“每个字词的发音方式,跟这个字词的意思,是有关联的。” 比如"大"时嘴形放大,"小"时嘴形缩小。

在SeeDance 2.0中,这种语音-视觉关联可以通过以下方式强化:

口型同步优化技巧:

  1. 关键词强调:在提示词中标注需要夸张口型的词汇

    "大"字口型夸张放大,"小"字嘴形收缩,
    "快"字发音快速,"慢"字拖长音
    
  2. 情绪-口型匹配

    • 惊讶:嘴形"O"型,眼睛睁大
    • 无奈:嘴角下拉,轻微摇头
    • 得意:嘴角上扬,眼神闪烁
  3. 东北口音效应:李诞特别提到东北口音的幽默效果。如果你的演员使用方言,可以在提示词中指定:

    东北口音,咬字活泛,"话还能这么说"的语感
    

5.2 “津津有味”:情境还原的AI实现

李诞说:“把一件事说得津津有味,是脱口秀演员表演的基本素质。” 在AI视频中,“津津有味”=情境还原+镜头语言

SeeDance 2.0情境还原三要素:

要素一:眼到手到

错误:演员说"我昨天看书看到凌晨三点"(无动作)
正确:演员眼神向下看,手指做翻书动作,头部微低,
      说到"凌晨三点"时抬头看观众,表情疲惫

要素二:空间定位

在描述"地铁拥挤"时,演员左手边是"左边大哥",
右手边是"右边阿姨",眼神和手势始终固定在这两个方向,
建立稳定的空间坐标系

要素三:情绪递进

0-10秒:平静叙述(建立情境)
10-20秒:逐渐夸张(积累情绪)
20-25秒:情绪爆发(包袱点)
25-30秒:回归平静(收束)

5.3 小情境与大情境:AI视频的结构设计

李诞将脱口秀表演分为"小情境"(单个段子)和"大情境"(整场主持)。在30-60秒的短视频中,这种结构依然适用。

短视频的"大情境"设计:

开场(0-5秒):建立"这是一个脱口秀现场"的大情境
    ↓
主体(5-25秒):2-3个小情境(段子段落)
    ↓
结尾(25-30秒):回归大情境,演员与观众互动

SeeDance 2.0的多镜头叙事:

利用时间戳实现小情境切换:

0-8秒:情境A(地铁场景)
8-10秒:过渡(演员转身,镜头快速横移)
10-20秒:情境B(办公室场景)
20-22秒:过渡(黑屏/闪白)
22-30秒:情境C(回家场景)+ 收束

关键技巧:过渡镜头要写得具体,“镜头快速横移”"黑屏转场"等描述能帮助AI理解节奏变化。

5.4 真诚与保护:AI演员的"人格"边界

李诞提醒:“脱口秀演员怎么抽离呢?怎么保护自己呢?我的办法一是做到只保证情绪永远是真的,文本可以是编造的,对真实人生可以有所修改。”

AI视频的"真诚"悖论:

  • 优势:AI演员可以完美执行"情绪真实",不会紧张、不会忘词
  • 风险:过度完美的表演可能显得"假",缺乏真人演员的"瑕疵美"

解决方案:

  1. 保留"瑕疵":在提示词中添加"轻微口误后自然纠正"“说到激动处轻微破音”
  2. 加入即兴感:“@Audio_Main中包含现场互动环节,演员表情有惊讶和应变”
  3. 限制完美:“不要过度修饰,保留现场表演的粗糙质感”

第六章:技术篇——永恒的难题:到底什么是节奏?

6.1 SeeDance 2.0的节奏控制工具

李诞承认:“到底什么是节奏?这是永恒的难题。” 但在AI视频中,节奏是可以被量化和技术化的

节奏控制三维度:

维度 控制工具 李诞式解读
时间节奏 提示词中的秒数标记 “该停顿的地方必须停顿”
视觉节奏 镜头运动速度 “镜头语言就是节奏”
情绪节奏 演员表情变化曲线 “只有情绪是真的”

时间戳精确控制示例:

0-3秒:镜头固定,演员静止,深吸气
3-4秒:突然开口,镜头轻微后拉(节奏突变)
4-12秒:正常讲述,镜头缓慢推近(积累)
12-13秒:包袱点,镜头快速推至特写(爆发)
13-15秒:停顿,演员表情凝固(留白)
15-18秒:放松,镜头回拉,演员微笑(释放)

6.2 镜头语言的"语法"

SeeDance 2.0支持丰富的镜头术语,这些是你的"导演语法":

基础镜头:

  • 推/拉(Dolly in/out):情绪递进/疏离
  • 摇/移(Pan/Tilt):空间展示/视线引导
  • 环绕(Orbit):强调/审视
  • 固定(Static):稳定/压迫感

进阶技巧:

  • 希区柯克变焦:背景压缩,突出心理变化
  • 一镜到底(One-shot):真实感,适合长段子
  • 跳切(Jump cut):喜剧效果,强调节奏

脱口秀专用镜头组合:

开场:全景→中景(建立现场感)
主体:中景稳定(专注内容)
包袱前:缓慢推近(积累期待)
包袱点:特写(捕捉表情)
等笑:固定(尊重反应)
结尾:中景→全景(回归现场)

6.3 音画同步的精确控制

SeeDance 2.0的音频集成功能支持90%+的唇形同步准确率,但要达到专业水准,需要精细调整。

音画同步优化流程:

  1. 音频预处理

    • 在剪映中标记每个字的精确时间点
    • 导出带时间码的音频文件
  2. 提示词时间戳对齐

    @Audio_Main的台词时间点:
    0.0秒:"我"
    0.3秒:"昨天"
    0.8秒:"坐地铁"
    ...
    
    对应画面:
    0.0秒:嘴型"我"(开口)
    0.3秒:嘴型"昨"(闭口转开口)
    0.8秒:嘴型"坐"(圆唇)
    
  3. 关键帧标记
    在包袱点、停顿点、情绪转折点添加"@关键帧"标记,确保AI重点处理

6.4 字幕与视觉元素的"隐形设计"

根据你提供的附录,字幕需要"分行短句,关键词高亮,下三分之一,不遮脸不遮麦"。

SeeDance 2.0字幕控制:

由于AI生成的字幕可能不稳定,建议采用后期叠加方案:

  1. 生成阶段:在提示词中添加"预留字幕安全区,下三分之一无重要画面"
  2. 后期阶段:在剪映/CapCut中添加动态字幕,确保:
    • 每行不超过8个字
    • 关键词用颜色/大小突出
    • 出现时机与台词同步(提前0.2秒出现,延后0.5秒消失)

第七章:工作流篇——开读稿会的正确方法

7.1 单人读稿会:AI视频的"自我审查"

李诞强调读稿会的重要性:“学习永远是学思路,学他是怎么想的。” 在AI视频制作中,你需要与自己开读稿会

自我审查清单:

审查维度 问题 李诞原话
价值观 这个段子在表达什么? “讲故事也是一种价值观”
真实性 这是我真实的观察吗? “只有情绪是真的”
节奏感 哪里该停?哪里该快? “到底什么是节奏?”
信息量 每个字都是必须的吗? “把字词删到不能再删”
观众视角 陌生人能听懂吗? “找到跟你想法一致的人”

AI辅助审查:
将你的提示词和生成结果输入Claude/GPT,询问:

  • “这个段子的笑点在哪里?”
  • “如果我是第一次看脱口秀的人,我能get到吗?”
  • “哪里节奏拖沓?哪里信息不足?”

7.2 版本管理:从"徒劳的准备"到"有意义的失败"

李诞区分了两种失败:“如果你的目标是这场一定要炸,那准备就永远是徒劳的。如果你的目标是变成一个越来越强的脱口秀演员,那就请永远都好好准备。”

AI视频版本管理策略:

V1.0:快速原型(首尾帧模式,1080P,验证创意)
    ↓ 审查:核心笑点是否成立?
V2.0:精细调整(全能参考模式,优化提示词)
    ↓ 审查:节奏和表演是否到位?
V3.0:最终输出(2K分辨率,完整多模态参考)
    ↓ 审查:是否达到发布标准?
V3.1:变体生成(同一提示词,2-4个版本)
    ↓ 选择:最佳版本发布,其他存档

"有意义的失败"记录:
建立失败案例库,记录:

  • 提示词版本
  • 失败表现(面部变形/节奏错乱/口型不同步等)
  • 解决方案
  • 最终效果对比

7.3 批量生产:MCN机构的"工业化"方案

对于需要批量产出内容的团队,SeeDance 2.0支持模板化工作流

标准化模板结构:

[演员形象库] → 10套固定人设
    ↓
[场景模板库] → 5种经典场景(剧场/酒吧/户外/居家/办公室)
    ↓
[音频素材库] → 分类台词(职场/情感/社会/家庭)
    ↓
[提示词模板] → 填空式生成
    ↓
[自动审核] → AI初筛+人工终审
    ↓
[批量输出] → 日更10-30条

李诞式警告:
“人是目的,不是手段。这不只是一种道德要求,也是很理性的结论。” 批量生产不能牺牲内容质量,每一条视频都应该是"成为更强的脱口秀演员"的练习


第八章:发布篇——每个人都该学会卖掉自己的想法

8.1 平台适配:不同平台的"情境"调整

李诞说:“我们呈现自己价值观的目的,是去找到跟你想法一致的人,而不是改变尽可能多的人。” 不同平台有不同的"观众情境",需要针对性调整。

平台适配指南:

平台 时长 节奏特点 SeeDance 2.0调整
抖音 15-30秒 快,3秒必出包袱 提示词添加"0-3秒快速建立冲突"
小红书 30-60秒 生活化,共鸣感 强化"情境还原",增加细节描写
B站 60秒+ 完整结构,可慢 使用"一镜到底",减少跳切
视频号 30-45秒 温和,适合转发 价值观表达更明确,结尾有金句

8.2 标题与封面的"钩子"设计

李诞强调:“你的段子要传播是需要主题的,是需要好笑之外还说了一点什么的。”

AI视频标题公式:

[具体场景] + [反常识观点] + [情绪承诺]

示例:
"地铁早高峰,我发现最挤的不是车厢,是人心"
"被催婚30次后,我终于学会了这句话"
"外卖迟到1小时,我却给了五星好评"

封面图生成:
使用SeeDance 2.0生成静态帧作为封面,提示词:

从视频中截取演员表情最夸张的一帧,
添加文字"[金句]",字体粗体高对比,
背景模糊处理,突出人物面部

8.3 数据反馈:用"发展的眼光看问题"

李诞分享的两句至理名言:“实事求是。用发展的眼光看问题。”

关键数据指标:

指标 健康标准 优化方向
3秒完播率 >50% 开场提示词优化,快速建立冲突
点赞率 >5% 包袱点提示词强化,确保"等笑"时机准确
评论率 >1% 价值观表达更明确,留出讨论空间
转发率 >0.5% 结尾金句设计,提供"社交货币"

迭代策略:
根据数据反馈,调整SeeDance 2.0提示词中的:

  • 开场节奏(前3秒)
  • 包袱位置(黄金8秒、15秒、22秒)
  • 结尾设计(金句/互动/留白)

第九章:进阶篇——比永恒更难的难题:到底什么是风格?

9.1 个人风格的AI化定义

李诞承认:“到底什么是风格?这是比永恒更难的难题。” 但在AI视频制作中,风格可以被拆解为可复制的参数

风格拆解模板:

风格维度 具体参数 SeeDance 2.0实现
视觉风格 色调、光影、质感 “暖色调,电影级光影,胶片质感”
表演风格 语速、手势幅度、表情强度 “语速中等偏快,手势幅度小,表情克制”
叙事风格 结构偏好、包袱密度、价值观倾向 “三段式结构,每10秒一个包袱,现实主义价值观”
镜头风格 运镜偏好、剪辑节奏、景别选择 “固定镜头为主,缓慢推近,中景特写交替”

个人风格固化:
当你找到有效的风格组合后,将其固化为模板提示词,每次只修改内容部分,保持风格参数不变。

9.2 跨界融合:脱口秀×其他艺术形式

SeeDance 2.0的多模态能力支持风格迁移,可以尝试:

实验方向:

  • 脱口秀×默片:黑白画面,夸张表情,字幕卡
  • 脱口秀×纪录片:手持摄影风格,真实场景穿插
  • 脱口秀×MV:音乐节奏驱动,快速剪辑,视觉隐喻

风险控制:
李诞警告:“别因为你是搞创作的,就觉得自己可以迟到,可以谩骂客户,可以斥责自己的同事不懂创作——除非你做得特别特别特别好——即使那样,也最好不要。” 跨界实验同样如此,先确保脱口秀的基本功扎实,再谈风格创新

9.3 从模仿到原创:AI辅助的"风格进化"

阶段一:模仿期

  • 使用SeeDance 2.0的"参考视频"功能,模仿知名脱口秀演员的表演风格
  • 提示词:“参考@视频1的运镜和表演节奏,演员形象替换为@图1”

阶段二:融合期

  • 结合多个参考源,创造混合风格
  • 提示词:“运镜参考@视频1,表演风格参考@视频2,视觉风格参考@视频3”

阶段三:原创期

  • 固化个人风格参数,形成独特标识
  • 建立个人风格库,批量生成一致化内容

第十章:伦理篇——前采的本质:真实与虚构的边界

10.1 AI视频的"真诚"悖论

李诞在"前采的本质"一节中讨论了真实与表演的关系。AI视频带来了新的伦理问题:当演员是数字生成的,"真诚"还重要吗?

核心原则:

  • 情绪真实 > 形象真实:观众需要感受到真实的情绪共鸣,至于演员是真人还是AI,是次要问题
  • 价值观真实 > 故事真实:段子可以是编造的,但表达的价值观必须是创作者真实的
  • 透明原则:如果AI生成痕迹明显,不妨主动承认,将其转化为"元喜剧"素材

10.2 版权与肖像:AI时代的"交易成本"

李诞用科斯的交易成本理论分析工作关系。在AI视频中,版权成本是必须考虑的:

风险控制清单:

  • 演员形象图是否为原创或已获得授权?
  • 音频素材是否包含受版权保护的音乐?
  • 参考视频是否来自公开授权素材?
  • 生成内容是否涉及真实人物的肖像权?

建议方案:

  • 使用原创形象或CC0授权素材作为@首帧
  • 音频使用原创录音或免版税音乐库
  • 商业用途前咨询法律意见

10.3 行业影响:AI会取代脱口秀演员吗?

李诞的答案是:“不是玩笑,是非常非常理性的推论…优秀人才的离开,至少能让这家公司改掉一些毛病。”

理性分析:

维度 AI的优势 人类的优势 结论
表演执行 不紧张、不忘词、可复制 即兴反应、现场互动、瑕疵美 各取所长
内容创作 快速生成、风格迁移 真实体验、价值观表达 人类核心
情感连接 可模拟 真实共鸣 人类不可替代

最终判断:
SeeDance 2.0是工具,不是替代品。它降低的是"表演执行"的交易成本,但**"创作洞察"和"价值观表达"依然是人类脱口秀演员的核心竞争力**。


附录:完整工具包

附录A:脱口秀通用提示词骨架(完整版)

【视频类型】单口脱口秀现场,竖屏 9:16,时长30-60秒

【演员/人设】
@Actor:28岁女性,干练短发,单眼皮,左脸颊痣,
        黑色高领毛衣+牛仔裤,手持银色Shure SM58麦克风,
        自信略带调侃气质

【舞台/场景】  
@Stage:小型剧场/Open Mic酒吧,深红色天鹅绒幕布,
        追光灯(直径1.5米暖白光),观众区昏暗轮廓5-8排

【表演指令】
动作:自然手势,走位范围小(直径1米内),
      包袱前停顿0.5秒(表情微妙变化),
      包袱后等笑1秒(眼神与观众交流)
表情:整体轻松自信,随内容递进变化,
      惊讶时睁大眼,无奈时嘴角下拉,得意时微扬

【镜头设计】
主机位:中景稳定(腰部以上)
包袱处:切一次特写(面部)
可选:1次观众反应镜头(快速切观众笑脸)

【声音设计】
@Audio:现场近讲麦克风,轻混响,
        观众笑声强度中等,只在包袱后出现

【字幕预留】
下三分之一安全区,分行短句(每行≤8字),
关键词高亮,不遮脸不遮麦

【风格约束】
写实/电影感,暖色调,质感真实,
4K高清,面部稳定不变形,手指正常,
麦克风不变形,观众轮廓正常,
无闪烁跳帧,无过度滤镜,无水印

附录B:分镜时间戳模板

0-3秒:@Actor站立舞台中央,深吸气,眼神扫视观众,
       镜头中景固定,追光灯渐亮,字幕"[开场金句]"出现

3-8秒:讲述开场白,自然手势配合,镜头轻微环绕,
       表情轻松,建立情境

8-12秒:推进至主体内容,语速略快,手势幅度加大,
        镜头缓慢推近至中近景

12-13秒:停顿0.5秒,表情微妙变化(挑眉/抿嘴),
         眼神与观众交流,制造期待

13-15秒:包袱点,特写,表情夸张变化,
         @SFX_Laugh切入,字幕"[包袱关键词]"高亮

15-18秒:等笑1秒,表情从得意转为无奈/无辜,
         镜头固定,捕捉反应

18-25秒:讲述后续内容,回归中近景,手势放松,
         节奏放缓,准备收束

25-28秒:结尾金句,语速放慢,眼神真诚,
         镜头缓慢后拉

28-30秒:微微鞠躬/摊手,观众掌声@SFX_Applause,
         灯光渐暗,字幕"[结束语]"

附录C:常见问题排查(Troubleshooting)

问题 可能原因 解决方案
面部变形 动作描述过快/复杂 添加"面部稳定不变形",简化动作
口型不同步 音频节奏标记不准 重新标记@Audio时间点,分段生成
手势扭曲 "手势"描述过于笼统 具体化:“右手食指指向前方,左手自然下垂”
节奏拖沓 提示词缺乏时间控制 添加精确秒数标记,限制单段时长
观众反应假 @SFX时机不准 后期添加真实笑声,或调整提示词时机
字幕遮挡 未预留安全区 添加"下三分之一无重要画面"约束

附录D:李诞金句索引(创作时参考)

“工作的本质是交易” —— 第1章
“你的全部人生都理应要为你的创作提供养分” —— 第2章
“请写逐字稿” —— 第3章
“创作不能靠雷劈,创作要自己没事就劈自己” —— 第4章
“讲故事也是一种价值观” —— 第5章
“如果你的目标是变成一个越来越强的脱口秀演员,那就请永远都好好准备” —— 第6章
“真诚是第一位的” —— 第7章
“舞台上什么都是真的” —— 第8章
“狠狠地操练自己,你越强,找到你的观众越多” —— 第9章
“只有情绪是真的” —— 第10章
“完成比完美重要” —— 第4章/第19章


结语:你是你的目的

李诞在手册结尾写道:“人是目的,不是手段…你是你的目的。”

在AI视频时代,这个提醒尤为重要。SeeDance 2.0可以帮你生成完美的画面、精准的节奏、专业的运镜,但它无法替代你成为脱口秀演员的理由——那些让你夜不能寐的观察,那些你想对世界说的话,那些只有你能表达的价值观。

技术永远是手段,表达才是目的。

用SeeDance 2.0降低交易成本,用李诞的方法论提升创作质量,最终——成为更强的脱口秀演员


参考资源:

  • SeeDance 2.0官方文档与即梦AI平台
  • 李诞《脱口秀工作手册》(江苏凤凰文艺出版社,2021)
  • VideoWeb AI Seedance 2.0生成指南
  • 什么值得买Seedance 2.0上手教程

本教程涵盖SeeDance 2.0脱口秀视频制作的完整工作流。建议收藏后分章节实践,每次专注优化一个环节。记住李诞的话:“以赛代练,错得够多了,自然就会了。”

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐