前言:AI 绘图的“恐怖谷”被填平了

做过 AI 绘图的朋友都有过这样的崩溃时刻:

  • 画一个美女,脸美若天仙,一看手——六根手指。
  • 想生成一张电影海报,画面质感无敌,但想在海报上写个标题,AI 给你画了一堆像古希腊文一样的乱码。
  • 写了一大段复杂的提示词(Prompt),模型只听懂了一半,剩下的全靠“抽卡”碰运气。

兄弟们,时代变了。

FLUX.1 的出现,就像是给 AI 绘图界扔了一颗核弹。它由 Black Forest Labs(黑森林实验室,原 SD 核心团队成员创立)推出。它最大的特点就是:听话、识字、手不残。

今天,我不教你怎么充钱用在线版。作为技术人,我们要玩就玩本地部署。我们要掌控模型,而不是被模型掌控。我们将使用 ComfyUI——这个最受程序员喜爱的、基于节点流的界面,来彻底榨干 FLUX.1 的性能。


第一部分:为什么是 FLUX.1?(技术原理浅析)

在开始烧显卡之前,我们先聊聊它为什么强。

1.1 混合架构的胜利

传统的 Stable Diffusion 主要依赖于 UNet 架构。而 FLUX.1 引入了 DiT (Diffusion Transformer) 架构(和 Sora 同源)。
简单来说,它结合了 Transformer(擅长理解语义,像 GPT 那样)和 Diffusion(擅长生成图像)的优点。

  • 结果: 它的参数量高达 120 亿(12B)。作为对比,SDXL 只有 26 亿(2.6B)。
  • 通俗理解: 如果 SDXL 是一个大专美术生,FLUX.1 就是一个拥有双博士学位的艺术大师。

1.2 Flow Matching(流匹配)

这是 FLUX.1 的核心黑科技。传统的扩散模型是从噪声中“瞎猜”去噪,路径曲折。而 Flow Matching 技术让模型找到了一条从噪声到图像的“直线路径”。

  • 优势: 生成步数大幅减少,画质却大幅提升。

1.3 终于能写字的 AI

这是 FLUX.1 最让设计师尖叫的地方。你在提示词里写 text "Hello CSDN",它真的能在图里给你精准地画出 “Hello CSDN”,字体工整,不再是乱码。这对于做海报、Logo、电商图来说,是革命性的。


第二部分:准备工作——你的显卡顶得住吗?

FLUX.1 是个“大块头”,对硬件有硬性要求。别急着下载,先看配置单。

2.1 硬件门槛

  • 显存(VRAM): 这是生死线。

    • 24GB (RTX 3090/4090): 完美运行 FLUX.1 [dev] 版本(全精度/半精度),速度飞快。
    • 16GB (4080/4070Ti): 可以运行,但建议使用 fp8 量化版本,或者忍受较慢的系统内存交换。
    • 12GB (3060/4070): 必须使用 nf4 或 fp8 量化版本。这是体验 FLUX 的底线。
    • 8GB 及以下: 劝退,或者去玩云端部署(Colab/AutoDL)。
  • 内存(RAM): 建议 32GB 起步。加载模型时需要大量内存。

2.2 软件环境

  • Python 3.10+
  • CUDA Toolkit 12.1+
  • ComfyUI: 我们的主角。

第三部分:ComfyUI 部署实战——程序员的绘图方式

为什么不用 WebUI (A1111)?因为 WebUI 封装太重,显存管理不如 ComfyUI 高效。ComfyUI 的节点式工作流(Node-based Workflow),本质上就是可视化编程,逻辑清晰,上限极高。

3.1 安装 ComfyUI

推荐使用秋叶大佬或者官方的便携包(Portable Version),解压即用,省去配置 Python 环境的痛苦。
如果你是硬核 Linux 用户:

git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
python main.py

3.2 下载 FLUX.1 模型文件

FLUX.1 有三个版本:

  1. Pro: 闭源 API 版本(最强)。
  2. Dev: 开源,不可商用,画质极佳(我们用这个)。
  3. Schnell: 开源,可商用,速度快(4步出图),但画质略逊。

你需要下载以下几个文件(HuggingFace 或 Civitai 都有):

  1. 大模型 (UNet/Checkpoint): flux1-dev.safetensors (约 23GB) -> 放入 ComfyUI/models/unet/checkpoints/
  2. VAE: ae.safetensors -> 放入 ComfyUI/models/vae/
  3. CLIP (文本编码器): FLUX 需要三个 CLIP 模型!
    • t5xxl_fp16.safetensors (或 fp8 版本省显存)
    • clip_l.safetensors
    • -> 放入 ComfyUI/models/clip/

(博主注:为了省显存,强烈建议下载 fp8 版本的权重文件,画质损失肉眼几乎不可见,但显存占用减半!)


第四部分:构建你的第一个 FLUX 工作流(连连看时间)

打开 ComfyUI,你会看到一片空白或者默认的 SD 工作流。别慌,我们来搭建 FLUX 专属流程。

4.1 核心节点解析

一个标准的 FLUX 工作流包含以下几个关键节点:

  1. Load Diffusion Model (UNet): 加载 flux1-dev。注意,FLUX 把 UNet 独立出来了。
  2. DualCLIPLoader: 同时加载 t5xxlclip_l。这是 FLUX 理解复杂语义的关键。
  3. VAELoader: 加载 ae.safetensors
  4. CLIP Text Encode (Prompt): 输入正向提示词。
    • 注意: FLUX 对负面提示词(Negative Prompt)不敏感,甚至不需要负面提示词节点!这和 SD 很不一样。
  5. Empty Latent Image: 设置分辨率。FLUX 推荐 1024x1024 或更高。
  6. SamplerCustom (采样器):
    • Sampler: euler (推荐)
    • Scheduler: simplebeta
    • Steps: Dev 版建议 20-30 步,Schnell 版只要 4 步。
  7. KSampler (高级): 将模型、Prompt、Latent 连接起来进行去噪。
  8. VAE Decode: 将潜空间数据解码成图片。
  9. Save Image: 输出图片。

4.2 偷懒大法:直接拖入 JSON

ComfyUI 最棒的功能就是:图片即代码
你可以去网上(如 Civitai 或 Discord)找一张别人用 FLUX 生成的原图,直接拖进 ComfyUI 的浏览器窗口,整个工作流(节点连线、参数设置)会瞬间复原!

(关注博主,私信“FLUX工作流”,我直接发给你我调教好的、针对 12G 显存优化的 JSON 文件)


第五部分:提示词工程——说“人话”就行

在 Stable Diffusion 时代,我们习惯了用“单词雨”:
masterpiece, best quality, 8k, highly detailed, 1girl, white hair...

在 FLUX.1 时代,请忘掉这种写法。
FLUX 使用了 T5 编码器,它能理解自然语言。你应该像给摄影师写需求文档一样写 Prompt。

5.1 描述性提示词范例

场景: 想要一张赛博朋克风格的猫咪海报。

  • 旧时代写法: cyberpunk cat, neon lights, rain, future city, realistic, 8k
  • FLUX 写法:

    “A cinematic close-up shot of a robotic cat sitting on a wet street in a futuristic cyberpunk city at night. Neon signs reflect in the puddles. The cat has glowing blue eyes and metallic fur. In the background, a large holographic sign displays the text ‘CYBER CAT’ in bold red letters. High contrast, photorealistic texture, depth of field.”

解析:

  1. 自然句式: 使用完整的句子。
  2. 指定文字: 直接用单引号包裹 'TEXT',FLUX 能精准识别。
  3. 细节描述: 描述光影、材质、景深,而不是堆砌 best quality 这种无意义的词。

第六部分:商业应用与变现思路

技术学到手,怎么用它创造价值?

  1. 电商模特图直出:
    FLUX 的皮肤质感极其真实,几乎没有“AI 塑料感”。结合 LoRA(最近 FLUX 的 LoRA 生态已经爆发),你可以训练特定服装的 LoRA,实现“不花钱请模特”就能生成高质量上身图。

  2. Logo 与海报设计:
    利用 FLUX 强大的文字渲染能力。以前 AI 做海报还要去 PS 里加字,现在直接生成带字的底图,效率提升 10 倍。

    • 案例: 客户需要一张咖啡店海报,要求写着 “Morning Coffee”。FLUX 一键搞定,连咖啡拉花的细节都完美。
  3. 游戏资产贴图:
    FLUX 生成的纹理(木头、金属、布料)非常清晰,非常适合作为 3D 建模的贴图素材。


结语:拥抱“节点化”的未来

FLUX.1 的强大毋庸置疑,但更重要的是 ComfyUI 这种工作流思维。

在 AI 时代,工具的迭代速度会越来越快。今天流行 FLUX,明天可能就是 GLUX。但**“模块化”、“流程式”**的解决问题的思维是永恒的。掌握了 ComfyUI,你就掌握了 AI 绘图的底层逻辑,无论模型怎么变,你都能快速适应。

别再犹豫了,趁着你的显卡还没过时,赶紧把 FLUX.1 部署起来。当你看到屏幕上那张连毛孔都清晰可见、手指根根分明的图片慢慢浮现时,你会发现,这一切折腾都是值得的。

如果你在部署过程中遇到报错(比如 CUDA Out of Memory),或者不知道怎么连接节点,请在评论区留言!

觉得文章硬核?请点赞、收藏、转发!你的支持是我继续肝“干货”的动力!

福利时间: 评论区回复“节点”,获取 FLUX.1 专属 ComfyUI 汉化插件及 100 个精选艺术家风格 Prompt 词典!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐