FluxGym是什么

        FluxGym 是一个专为 FLUX 模型设计的、极简化的 LoRA 训练工具。它的核心目的是让普通用户在消费级显卡(如 12GB/16GB 显存)上也能轻松LoRA,训练 AI 模型,无需面对复杂的参数设置,如果你想给 FLUX 炼制一个角色或画风 LoRA,但不想学习复杂的训练参数,FluxGym 是目前最适合新手的“傻瓜式”入门工具。

        部署安装

        1.使用git clone官方仓库

                git clone https://github.com/cocktailpeanut/fluxgym
                cd fluxgym
                git clone -b sd3 https://github.com/kohya-ss/sd-scripts

        2.创建python虚拟环境

                python -m venv env

        3.安装依赖

                cd sd-scripts
                pip install -r requirements.txt

                回到上级目录fluxgym安装依赖

                cd ..
                pip install -r requirements.txt

        4.安装适配你的cuda环境的pytorch

                在这个链接中(Previous PyTorch Versions)可以看到适合你cuda环境的pytorch

                nvidia-smi  检查你的显卡支持的最高 CUDA 版本

                看右上角的 CUDA Version: xx.x

                安装适合你的cuda环境pytorch

             pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

                如若安装过程中发生报错,一般都是依赖安装错误,建议直接将报错信息发送给gemini,使用gemini分析依赖,进行安装即可。

               到这里已经安装部署完成

        5.验证

                启用venv,运行:fluxgym

                python app.py,若能跳转到web页面

        6.制作bat脚本快捷方式

                直接使用gemini或其他AI制作bat脚本

                给gemini发送以下信息:

我需要你给我写一个bat文件,内容是执行以下命令:进入D:\AI_ENVS\fluxgym路径,执行cmd:

env\Scripts\activate ,然后输入:python app.py

                现在可以使用bat快捷方式进入fluxgym

        7.安装fluxgym模型

      fluxgym\models\clip路径下存放clip文件,下载链接如下


https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/t5xxl_fp16.safetensors?download=true

https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/clip_l.safetensors?download=true

        fluxgym\models\unet路径下存放模型主文件,下载链接如下

https://huggingface.co/cocktailpeanut/xulf-dev/resolve/main/flux1-dev.sft?download=true

        fluxgym\models\vae路径下存放VAE文件,下载链接如下

https://huggingface.co/cocktailpeanut/xulf-dev/resolve/main/flux1-dev.sft?download=true

        fluxgym参数设置

参数名 含义 推荐设置 / 建议
The name of your LoRA LoRA 文件名。最终生成的 .safetensors 文件就会叫这个名字。 建议用英文,不要包含特殊符号。例如 my_cat_style_v1
Trigger word/sentence 触发词。这是你将来在生图时,用来激活这个 LoRA 效果的关键词。 非常重要。建议起一个生僻的词,比如 ohwx 或者 sks girl,避免和模型原本认识的词(如 dog)冲突。
Base model 底模。选择基于哪个 FLUX 版本进行训练。 首选 flux-dev。这是目前画质最好、兼容性最强的版本。除非你专门为了极速出图,否则不要选 flux-schnell
VRAM 显存限制。告诉程序你的显卡有多大显存。 20G ( High)。因为你用的是 RTX 4090 (24G),选最高档位可以让程序自动把 Batch Size 开大,训练更快。
Repeat trains per image 单图重复次数。每个 Epoch 中,每张素材图片被学习的次数。 10 - 20。如果素材少(<20张),设为 20;如果素材多(>100张),设为 5  10
Max Train Epochs 最大训练轮数。整个数据集被完整训练多少轮。 10 - 20。通常 15-20 轮能得到较好的结果。太少学不会,太多会过拟合(画面崩坏)。
Sample Image... 采样预览设置。每隔多少步生成一张预览图。 建议设置 Every N Steps  500  1000。设为 0 则不生成预览(最快)。
Resize dataset images 自动缩放分辨率。 512, 768,  1024FLUX 对分辨率不敏感,1024 效果最好但最慢。512 速度快但细节稍差。

                导入我们的训练集,训练集来自人物360°旋转工作流产生的数据集comfyui通义万相wan2.1+人物360°旋转工作流实战_wan2.1 360°旋转工作流 下载-CSDN博客

                等待lora训练完成

                结束后,训练的lora文件默认存放在fluxgym\outputs路径下

        comfyui验证lora成果

        基础工作流即可,加载fluxgym专用clip、vae、主模型。值得注意的是提示词一定要输入你在Trigger word/sentence设置的触发词,可去更改其他提示词验证LoRA效果。

如果您觉得此文对您有帮助,请点赞收藏转发,以便让更多人看到。

此账号持续更新各种comfyui实战工作流,欢迎关注!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐