HunyuanVideo1.5：从模型体系到工作流，再到 LoRA 模型训练，只需这一篇完全指南！

混元Video1.5提供了完整的视频生成工作流，包含文生视频、图生视频和视频放大三大功能模块，支持480p/720p分辨率输出，并通过放大模型提升至1080p。系统提供LoRA模型训练功能，可进行人物角色和特效训练，需准备60张以上素材，设置触发词并进行格式转换。关键参数包括CFG值、shift值和步数设置（建议50步），视频时长通过帧数控制（默认24fps）。工作流支持逐步放大优化生成质量，角色

2601_95544990

340人浏览 · 2026-03-20 13:49:54

2601_95544990 · 2026-03-20 13:49:54 发布

一、掌握Hunyuan Video 1.5

1.Hunyuan Video 1.5从入门到进阶

1）ComfyUI管理大师

工作流分析

核心功能：混元Video1.5提供完整的视频生成工作流，包括文生视频、图生视频和视频放大三大功能模块。

分辨率支持：支持480p和720p两种基础分辨率生成，并可通过视频放大模型提升至1080p。

性能优化：提供CFD蒸流模型可显著提升生成速度，建议工作流顺序：480p→720p→1080p逐步放大。

文生视频工作流

模型选择：

提供480p/720p基础模型及蒸馏模型

720p模型需设置CFG=6，shift=9

480p蒸馏模型CFG=1，shift=5

关键参数：

步数建议50（最低20）

需指定视频宽高（如1280×720）

时长通过帧数控制（默认24fps）

操作流程：

下载纯净整合包

一键安装工作流文件

重启ComfyUI加载工作流

视频放大工作流

功能特点：

支持720p→1080p放大

可保持原始视频时序稳定性

优化技巧：

填写原始提示词可提升放大质量

推荐参数：宽1920×高1080

噪波增强建议值0.70

操作步骤：

上传待放大视频

设置输出分辨率

运行放大流程

图生视频工作流

核心要素：

需上传起始图片

必须填写详细场景提示词

支持480p/720p输出

参数配置：

720p蒸馏模型：CFG=1，shift=7

帧数控制视频时长

建议步数50（最低20）

典型应用：

角色动作生成

特效转换

场景延展

资源获取与安装

安装步骤：

下载模型包覆盖models文件夹

导入三个工作流文件

通过ComfyUI管理大师一键安装

注意事项：

需保证网络畅通

模型文件较大建议手动下载

安装后需重启ComfyUI

2）人物角色LoRA训练

人物角色LoRA模型训练流程

核心功能：通过训练LoRA模型实现角色一致性视频生成

基本条件：需要准备角色素材数据集（如60张角色图片）

训练优势：使用LoRA训练大师可免环境配置，实现可视化训练管理

数据准备阶段

创建数据集：

点击"新建数据集"按钮

命名规范示例：搅拌手自然语言达标

支持添加图片/视频素材（推荐分辨率1024×1024）

素材要求：需要统一角色但不同姿态/场景的素材（如示例中的60张AI搅拌手图片）

自动打标设置

打标类型：

描述式标签（自然语言描述）

SD标签（Stable Diffusion专用格式）

列表式标签

参数设置：

随机度：数值越高标签越多样

生成长度：控制标签详细程度

最大token数：防止生成过长标签

操作流程：设置完成后点击"开始打标"→"统一打标"

触发词设置

关键设置：

需设置唯一触发词（如"AI搅拌手"）

支持追加到标签头部/尾部或替换原有标签

示例操作：输入触发词→点击"追加到头部"→确定

训练参数配置

基础设置：

任务命名规范：混元v1.5_AI搅拌手_V5

底模选择：混元v1.5_t2v_720p

训练轮数：默认100轮（60张图片×100轮=6000步）

显存优化：

12G/16G显存：需开启低显存模式

大显存设备：可关闭分块优化

采样设置：可设置提示词预览训练效果（如"搅拌手开车"场景）

训练监控

进度跟踪：

混元v1.5模型约1000步即可初步拟合

可通过Loss曲线监控训练状态（按步数/轮数显示）

模型输出：

默认每20轮和每1000步保存检查点

最终生成.safetensors格式模型文件（如HunYuanVideo1.5_AIJBS_V4.safetensors）

模型转换与应用

格式转换：

混元模型需转换为ComfyUI专用格式（添加_comfy后缀）

转换后保存路径与原模型相同

工作流集成：

在文生视频基础工作流中添加Lora Loader节点

模型选择转换后的_comfy.safetensors文件

提示词必须包含触发词（如"AI搅拌手驾驶跑车"）

效果验证：

成功生成角色一致性视频（示例为AI搅拌手驾驶跑车场景）

支持通过调整strength参数控制角色特征强度（默认1.0）

3）图生视频特效LoRA训练

示例：燃烧骷髅特效LoRA训练

训练流程：

素材准备：下载特效素材并处理成16帧/秒的视频格式

数据集创建：

在LoRA训练大师中新建"人物变火"数据集

添加处理好的视频素材

使用统一标签功能打标（如"characters turn into flames and burn brightly"）

模型训练：

选择混元video1.5 720P作为基础模型

设置训练参数：学习率0.0001，网络维度32，adamw优化器

启用过程采样监控训练效果

模型转换：

训练完成后需转换为ComfyUI兼容格式（添加_comfy后缀）

转换后的模型放入ComfyUI的models/loras目录

应用方法：

在ComfyUI中加载转换后的LoRA模型

输入触发词（即训练时使用的标签）

上传任意图片即可生成燃烧骷髅特效

可调整生成参数：视频尺寸（推荐1024×768）、采样步数（建议50步）

示例：2D动效特效LoRA训练

关键步骤：

数据准备：

收集2D动效视频素材（如粒子效果、光效等）

统一处理为16帧/秒的MP4格式

训练配置：

创建"2D动效_V2"数据集

设置分桶分辨率：416×240

启用低显存模式（12G显存可运行，推荐16G+）

参数优化：

使用分块训练技术提升显存利用率

设置梯度累积步数100

采用混合精度(fp16)加速训练

效果验证：

通过过程采样实时查看训练效果

分析Loss曲线（步数/轮数双维度）

可提前终止训练（当采样效果达标时）

应用技巧：

最终模型需转换为ComfyUI格式

在工作流中设置触发词"2D animation effects"

可结合基础视频生成工作流实现批量处理

二、知识小结

知识点	核心内容	关键操作/技术要点	难度系数
混元Video 1.5 工作流	包含文生视频、图生视频、视频放大三种工作流，支持480p/720p分辨率	- 选择模型（480p/720p/蒸馏模型）- 参数设置（CFG=6, shift=9, 步数=50）- 输入提示词、宽高、时长	⭐⭐
视频放大模型	支持480p→720p、720p→1080p放大	- 上传待放大视频- 填写提示词提升质量- 设置目标分辨率（如1920×1080）	⭐⭐
角色LoRA训练	通过角色素材训练LoRA模型，实现角色一致性视频生成	- 准备角色数据集（60+张）- 自动打标+触发词设置（如“AI搅拌手”）- 训练参数：100轮×60图=6000步	⭐⭐⭐⭐
特效LoRA训练	训练视频特效模型（如燃烧骷髅、2D动效）	- 处理素材为16帧/秒视频- 统一打标+触发词- 图生视频参数：CFG=1, shift=7, 步数=50	⭐⭐⭐
混元Video 1.5优势	运镜效果优于其他模型（如SVD 1.1），支持蒸馏模型加速生成	- 直接生成720p或分步放大（480p→720p→1080p）- 角色/特效LoRA需格式转换（加_comfy后缀）	⭐⭐