为什么要做人物360°旋转?

        一个人物360°旋转后可抽帧后作为数据集,LoRA自己的专属人物模型。

本文涉及两个工作流:

        1.人物360°旋转,生成新视频、或抽帧

        2.将人物从图片背景中抠图出来,形成数据集

工作流一:人物360°旋转

以下篇幅只对重点节点详解。

UNet加载器:加载wan2.1 480P模型(来自Kijai/WanVideo_comfy · Hugging Face),因GPU算力原因,未使用wan2.2模型。

LoRA加载器:360_enpoch20(来自Civitai: The Home of Open-Source Generative AI),此LoRA是人物能够旋转的关键模型。

TeaCache节点:核心作用是预加载并缓存指定大模型的资源,减少重复加载的时间成本,提升工作流的运行效率(尤其适用于 Wan2.1 这类大参数量模型),大幅缩短工作流的启动与运行耗时。

        model_type:选择对应的主模型,如wan2.1_I2V_480P_14B

        rel_L1 thresh:高分辨率锐度配置,对应模型的高分辨率锐度参数,缓存时同步加载该配置资源,保证模型高分辨率输出的锐度效果。

        start_percent:缓存加载起始比例:从模型资源的开头(0% 位置)开始加载缓存。

        end_percent:缓存加载结束比例:加载模型的全部资源(100%),若需快速预览可降低该值(如 0.5 表示仅缓存 50% 资源)。

        cache_device:缓存存储设备:将模型缓存到 GPU 显存中,后续调用模型时速度极快;若设为 “cpu” 则缓存到 CPU 内存,显存占用低但调用速度较慢。

正向提示词:ultra realistic, super high detail, modeling, steady camera. r0t4tion 360 degrees rotatio其中r0t4tion 360 degrees rotation是人物旋转特定标识,必须添加

反向提示词:色调艳丽,过曝,细节模糊不清,字幕,风格,作品,画作,画面,整体发灰,最差质量,低质量,JPEG压缩残留,丑陋的,残缺的,多余的手指,画得不好的手部,画得不好的脸部,畸形的,毁容的,形态畸形的肢体,手指融合,杂乱的背景,三条腿,背景人很多,倒着走

保存图片节点:在RIFE Frame Interpolation进行了插帧后,Video CombineRIFE 之前,保存图片,方便下一环节的抠图去除背景。

最终视频效果,可明显观察人物进行360°旋转。

工作流二:将人物从图片背景中抠图出来

主要涉及BRIA_RMBG模型及对应插件,以下是BRIA_RMBG介绍:

        BRIA_RMBG是由 BRIA AI 开发的先进图像背景移除模型,全称为 "BRIA Background Removal",是一款基于深度学习的图像分割工具,能精准识别并分离图像中的前景与背景。

BRIA_RMBG Model Loader节点:加载BRIA_RMBG 1.4模型,模型下载链接briaai/RMBG-1.4 · Hugging Face,下载model.pth,模型放置在comfyui目录\custom_nodes\ComfyUI-BRIA_AI-RMBG\RMBG-1.4路径下。

BRIA RMBG节点:负责执行图像背景移除操作,是 BRIA RMBG 工作流的核心执行组件。

Load Images (Path)节点:按照指定路径批量加载图片。

最终图片效果,可明显观察到人物从背景中抠出来了,可作为LoRA训练集了。

如果您觉得此文对您有帮助,请点赞收藏转发,以便让更多人看到。

此账号持续更新各种comfyui实战工作流,欢迎关注!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐