一、掌握Hunyuan Video 1.5

1.Hunyuan Video 1.5从入门到进阶

1)ComfyUI管理大师

工作流分析

核心功能:混元Video1.5提供完整的视频生成工作流,包括文生视频、图生视频和视频放大三大功能模块。

分辨率支持:支持480p和720p两种基础分辨率生成,并可通过视频放大模型提升至1080p。

性能优化:提供CFD蒸流模型可显著提升生成速度,建议工作流顺序:480p→720p→1080p逐步放大。

文生视频工作流

模型选择:

提供480p/720p基础模型及蒸馏模型

720p模型需设置CFG=6,shift=9

480p蒸馏模型CFG=1,shift=5

关键参数:

步数建议50(最低20)

需指定视频宽高(如1280×720)

时长通过帧数控制(默认24fps)

操作流程:

下载纯净整合包

一键安装工作流文件

重启ComfyUI加载工作流

视频放大工作流

功能特点:

支持720p→1080p放大

可保持原始视频时序稳定性

优化技巧:

填写原始提示词可提升放大质量

推荐参数:宽1920×高1080

噪波增强建议值0.70

操作步骤:

上传待放大视频

设置输出分辨率

运行放大流程

图生视频工作流

核心要素:

需上传起始图片

必须填写详细场景提示词

支持480p/720p输出

参数配置:

720p蒸馏模型:CFG=1,shift=7

帧数控制视频时长

建议步数50(最低20)

典型应用:

角色动作生成

特效转换

场景延展

资源获取与安装

安装步骤:

下载模型包覆盖models文件夹

导入三个工作流文件

通过ComfyUI管理大师一键安装

注意事项:

需保证网络畅通

模型文件较大建议手动下载

安装后需重启ComfyUI

2)人物角色LoRA训练

人物角色LoRA模型训练流程

核心功能:通过训练LoRA模型实现角色一致性视频生成

基本条件:需要准备角色素材数据集(如60张角色图片)

训练优势:使用LoRA训练大师可免环境配置,实现可视化训练管理

数据准备阶段

创建数据集:

点击"新建数据集"按钮

命名规范示例:搅拌手自然语言达标

支持添加图片/视频素材(推荐分辨率1024×1024)

素材要求:需要统一角色但不同姿态/场景的素材(如示例中的60张AI搅拌手图片)

自动打标设置

打标类型:

描述式标签(自然语言描述)

SD标签(Stable Diffusion专用格式)

列表式标签

参数设置:

随机度:数值越高标签越多样

生成长度:控制标签详细程度

最大token数:防止生成过长标签

操作流程:设置完成后点击"开始打标"→"统一打标"

触发词设置

关键设置:

需设置唯一触发词(如"AI搅拌手")

支持追加到标签头部/尾部或替换原有标签

示例操作:输入触发词→点击"追加到头部"→确定

训练参数配置

基础设置:

任务命名规范:混元v1.5_AI搅拌手_V5

底模选择:混元v1.5_t2v_720p

训练轮数:默认100轮(60张图片×100轮=6000步)

显存优化:

12G/16G显存:需开启低显存模式

大显存设备:可关闭分块优化

采样设置:可设置提示词预览训练效果(如"搅拌手开车"场景)

训练监控

进度跟踪:

混元v1.5模型约1000步即可初步拟合

可通过Loss曲线监控训练状态(按步数/轮数显示)

模型输出:

默认每20轮和每1000步保存检查点

最终生成.safetensors格式模型文件(如HunYuanVideo1.5_AIJBS_V4.safetensors)

模型转换与应用

格式转换:

混元模型需转换为ComfyUI专用格式(添加_comfy后缀)

转换后保存路径与原模型相同

工作流集成:

在文生视频基础工作流中添加Lora Loader节点

模型选择转换后的_comfy.safetensors文件

提示词必须包含触发词(如"AI搅拌手驾驶跑车")

效果验证:

成功生成角色一致性视频(示例为AI搅拌手驾驶跑车场景)

支持通过调整strength参数控制角色特征强度(默认1.0)

3)图生视频特效LoRA训练

示例:燃烧骷髅特效LoRA训练

训练流程:

素材准备:下载特效素材并处理成16帧/秒的视频格式

数据集创建:

在LoRA训练大师中新建"人物变火"数据集

添加处理好的视频素材

使用统一标签功能打标(如"characters turn into flames and burn brightly")

模型训练:

选择混元video1.5 720P作为基础模型

设置训练参数:学习率0.0001,网络维度32,adamw优化器

启用过程采样监控训练效果

模型转换:

训练完成后需转换为ComfyUI兼容格式(添加_comfy后缀)

转换后的模型放入ComfyUI的models/loras目录

应用方法:

在ComfyUI中加载转换后的LoRA模型

输入触发词(即训练时使用的标签)

上传任意图片即可生成燃烧骷髅特效

可调整生成参数:视频尺寸(推荐1024×768)、采样步数(建议50步)

示例:2D动效特效LoRA训练

关键步骤:

数据准备:

收集2D动效视频素材(如粒子效果、光效等)

统一处理为16帧/秒的MP4格式

训练配置:

创建"2D动效_V2"数据集

设置分桶分辨率:416×240

启用低显存模式(12G显存可运行,推荐16G+)

参数优化:

使用分块训练技术提升显存利用率

设置梯度累积步数100

采用混合精度(fp16)加速训练

效果验证:

通过过程采样实时查看训练效果

分析Loss曲线(步数/轮数双维度)

可提前终止训练(当采样效果达标时)

应用技巧:

最终模型需转换为ComfyUI格式

在工作流中设置触发词"2D animation effects"

可结合基础视频生成工作流实现批量处理

二、知识小结
知识点 核心内容 关键操作/技术要点 难度系数
混元Video 1.5 工作流 包含文生视频、图生视频、视频放大三种工作流,支持480p/720p分辨率 - 选择模型(480p/720p/蒸馏模型)- 参数设置(CFG=6, shift=9, 步数=50)- 输入提示词、宽高、时长 ⭐⭐
视频放大模型 支持480p→720p、720p→1080p放大 - 上传待放大视频- 填写提示词提升质量- 设置目标分辨率(如1920×1080) ⭐⭐
角色LoRA训练 通过角色素材训练LoRA模型,实现角色一致性视频生成 - 准备角色数据集(60+张)- 自动打标+触发词设置(如“AI搅拌手”)- 训练参数:100轮×60图=6000步 ⭐⭐⭐⭐
特效LoRA训练 训练视频特效模型(如燃烧骷髅、2D动效) - 处理素材为16帧/秒视频- 统一打标+触发词- 图生视频参数:CFG=1, shift=7, 步数=50 ⭐⭐⭐
混元Video 1.5优势 运镜效果优于其他模型(如SVD 1.1),支持蒸馏模型加速生成 - 直接生成720p或分步放大(480p→720p→1080p)- 角色/特效LoRA需格式转换(加_comfy后缀) ⭐⭐

可点击下方原文链接观看视频教程👇

https://comfyit.cn/blog/213/?invite_code=TSH

LoRA训练大师官网下载地址

https://loramaster.com/

夸克: https://pan.quark.cn/s/a770f2051e2e

百度: https://pan.baidu.com/s/1yOgv2L3AvNJLA2FyJNC8BA?pwd=55hj

云端训练镜像地址(搜LoRA训练大师):https://www.xiangongyun.com/register/7IQBMI

训练实战案例合集:https://comfyit.cn/blog/204/?invite_code=TSH

ComfyUI管理大师(最好用的ComfyUI管理器):https://comfyit.cn//?invite_code=TSH

裙:559826331

温馨提示:

1、本软件适用于本地Windows系统、英伟达显卡。

2、团队付出了太多,需要收回一些成本(很便宜),健康发展下去,感谢理解和支持!

3、本软件设置了100个3天试用授权码,可以在评论区回复:“666,已三连”。会私信发送试用授权码。试用授权码可以体验所有功能!

4、相信和支持AI搅拌手团队的朋友,闭眼入即可,因为专业,所以放心!

5、LoRA训练大师会根据开发计划和用户的反馈,不断迭代和优化,支持市面上所有流行的lora模型训练,让LoRA模型训练变得更加简单而可控!

感谢大家的支持!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐