HunyuanVideo1.5:从模型体系到工作流,再到 LoRA 模型训练,只需这一篇完全指南!
混元Video1.5提供了完整的视频生成工作流,包含文生视频、图生视频和视频放大三大功能模块,支持480p/720p分辨率输出,并通过放大模型提升至1080p。系统提供LoRA模型训练功能,可进行人物角色和特效训练,需准备60张以上素材,设置触发词并进行格式转换。关键参数包括CFG值、shift值和步数设置(建议50步),视频时长通过帧数控制(默认24fps)。工作流支持逐步放大优化生成质量,角色
一、掌握Hunyuan Video 1.5
1.Hunyuan Video 1.5从入门到进阶








1)ComfyUI管理大师
工作流分析



核心功能:混元Video1.5提供完整的视频生成工作流,包括文生视频、图生视频和视频放大三大功能模块。
分辨率支持:支持480p和720p两种基础分辨率生成,并可通过视频放大模型提升至1080p。
性能优化:提供CFD蒸流模型可显著提升生成速度,建议工作流顺序:480p→720p→1080p逐步放大。
文生视频工作流


模型选择:
提供480p/720p基础模型及蒸馏模型
720p模型需设置CFG=6,shift=9
480p蒸馏模型CFG=1,shift=5
关键参数:
步数建议50(最低20)
需指定视频宽高(如1280×720)
时长通过帧数控制(默认24fps)
操作流程:
下载纯净整合包
一键安装工作流文件
重启ComfyUI加载工作流
视频放大工作流


功能特点:
支持720p→1080p放大
可保持原始视频时序稳定性
优化技巧:
填写原始提示词可提升放大质量
推荐参数:宽1920×高1080
噪波增强建议值0.70
操作步骤:
上传待放大视频
设置输出分辨率
运行放大流程
图生视频工作流


核心要素:
需上传起始图片
必须填写详细场景提示词
支持480p/720p输出
参数配置:
720p蒸馏模型:CFG=1,shift=7
帧数控制视频时长
建议步数50(最低20)
典型应用:
角色动作生成
特效转换
场景延展
资源获取与安装

安装步骤:
下载模型包覆盖models文件夹
导入三个工作流文件
通过ComfyUI管理大师一键安装
注意事项:
需保证网络畅通
模型文件较大建议手动下载
安装后需重启ComfyUI
2)人物角色LoRA训练
人物角色LoRA模型训练流程

核心功能:通过训练LoRA模型实现角色一致性视频生成
基本条件:需要准备角色素材数据集(如60张角色图片)
训练优势:使用LoRA训练大师可免环境配置,实现可视化训练管理
数据准备阶段

创建数据集:
点击"新建数据集"按钮
命名规范示例:搅拌手自然语言达标
支持添加图片/视频素材(推荐分辨率1024×1024)
素材要求:需要统一角色但不同姿态/场景的素材(如示例中的60张AI搅拌手图片)
自动打标设置

打标类型:
描述式标签(自然语言描述)
SD标签(Stable Diffusion专用格式)
列表式标签
参数设置:
随机度:数值越高标签越多样
生成长度:控制标签详细程度
最大token数:防止生成过长标签
操作流程:设置完成后点击"开始打标"→"统一打标"
触发词设置

关键设置:
需设置唯一触发词(如"AI搅拌手")
支持追加到标签头部/尾部或替换原有标签
示例操作:输入触发词→点击"追加到头部"→确定
训练参数配置

基础设置:
任务命名规范:混元v1.5_AI搅拌手_V5
底模选择:混元v1.5_t2v_720p
训练轮数:默认100轮(60张图片×100轮=6000步)
显存优化:
12G/16G显存:需开启低显存模式
大显存设备:可关闭分块优化
采样设置:可设置提示词预览训练效果(如"搅拌手开车"场景)
训练监控


进度跟踪:
混元v1.5模型约1000步即可初步拟合
可通过Loss曲线监控训练状态(按步数/轮数显示)
模型输出:
默认每20轮和每1000步保存检查点
最终生成.safetensors格式模型文件(如HunYuanVideo1.5_AIJBS_V4.safetensors)
模型转换与应用


格式转换:
混元模型需转换为ComfyUI专用格式(添加_comfy后缀)
转换后保存路径与原模型相同
工作流集成:
在文生视频基础工作流中添加Lora Loader节点
模型选择转换后的_comfy.safetensors文件
提示词必须包含触发词(如"AI搅拌手驾驶跑车")

效果验证:
成功生成角色一致性视频(示例为AI搅拌手驾驶跑车场景)
支持通过调整strength参数控制角色特征强度(默认1.0)
3)图生视频特效LoRA训练
示例:燃烧骷髅特效LoRA训练



训练流程:
素材准备:下载特效素材并处理成16帧/秒的视频格式
数据集创建:
在LoRA训练大师中新建"人物变火"数据集
添加处理好的视频素材
使用统一标签功能打标(如"characters turn into flames and burn brightly")
模型训练:
选择混元video1.5 720P作为基础模型
设置训练参数:学习率0.0001,网络维度32,adamw优化器
启用过程采样监控训练效果
模型转换:
训练完成后需转换为ComfyUI兼容格式(添加_comfy后缀)
转换后的模型放入ComfyUI的models/loras目录


应用方法:
在ComfyUI中加载转换后的LoRA模型
输入触发词(即训练时使用的标签)
上传任意图片即可生成燃烧骷髅特效
可调整生成参数:视频尺寸(推荐1024×768)、采样步数(建议50步)
示例:2D动效特效LoRA训练




关键步骤:
数据准备:
收集2D动效视频素材(如粒子效果、光效等)
统一处理为16帧/秒的MP4格式
训练配置:
创建"2D动效_V2"数据集
设置分桶分辨率:416×240
启用低显存模式(12G显存可运行,推荐16G+)
参数优化:
使用分块训练技术提升显存利用率
设置梯度累积步数100
采用混合精度(fp16)加速训练

效果验证:
通过过程采样实时查看训练效果
分析Loss曲线(步数/轮数双维度)
可提前终止训练(当采样效果达标时)
应用技巧:


最终模型需转换为ComfyUI格式
在工作流中设置触发词"2D animation effects"
可结合基础视频生成工作流实现批量处理


二、知识小结
| 知识点 | 核心内容 | 关键操作/技术要点 | 难度系数 |
| 混元Video 1.5 工作流 | 包含文生视频、图生视频、视频放大三种工作流,支持480p/720p分辨率 | - 选择模型(480p/720p/蒸馏模型)- 参数设置(CFG=6, shift=9, 步数=50)- 输入提示词、宽高、时长 | ⭐⭐ |
| 视频放大模型 | 支持480p→720p、720p→1080p放大 | - 上传待放大视频- 填写提示词提升质量- 设置目标分辨率(如1920×1080) | ⭐⭐ |
| 角色LoRA训练 | 通过角色素材训练LoRA模型,实现角色一致性视频生成 | - 准备角色数据集(60+张)- 自动打标+触发词设置(如“AI搅拌手”)- 训练参数:100轮×60图=6000步 | ⭐⭐⭐⭐ |
| 特效LoRA训练 | 训练视频特效模型(如燃烧骷髅、2D动效) | - 处理素材为16帧/秒视频- 统一打标+触发词- 图生视频参数:CFG=1, shift=7, 步数=50 | ⭐⭐⭐ |
| 混元Video 1.5优势 | 运镜效果优于其他模型(如SVD 1.1),支持蒸馏模型加速生成 | - 直接生成720p或分步放大(480p→720p→1080p)- 角色/特效LoRA需格式转换(加_comfy后缀) | ⭐⭐ |
可点击下方原文链接观看视频教程👇
https://comfyit.cn/blog/213/?invite_code=TSH
LoRA训练大师官网下载地址
https://loramaster.com/
夸克: https://pan.quark.cn/s/a770f2051e2e
百度: https://pan.baidu.com/s/1yOgv2L3AvNJLA2FyJNC8BA?pwd=55hj
云端训练镜像地址(搜LoRA训练大师):https://www.xiangongyun.com/register/7IQBMI
训练实战案例合集:https://comfyit.cn/blog/204/?invite_code=TSH
ComfyUI管理大师(最好用的ComfyUI管理器):https://comfyit.cn//?invite_code=TSH
裙:559826331
温馨提示:
1、本软件适用于本地Windows系统、英伟达显卡。
2、团队付出了太多,需要收回一些成本(很便宜),健康发展下去,感谢理解和支持!
3、本软件设置了100个3天试用授权码,可以在评论区回复:“666,已三连”。会私信发送试用授权码。试用授权码可以体验所有功能!
4、相信和支持AI搅拌手团队的朋友,闭眼入即可,因为专业,所以放心!
5、LoRA训练大师会根据开发计划和用户的反馈,不断迭代和优化,支持市面上所有流行的lora模型训练,让LoRA模型训练变得更加简单而可控!
感谢大家的支持!
更多推荐



所有评论(0)