今天给大家演示一个基于 ComfyUI 的双阶段生成与放大工作流,该流程通过加载不同的核心模型,结合提示词与负面提示的文本编码,先生成初始图像,再利用潜空间放大与二次采样实现高分辨率、细节更丰富的最终输出。工作流的设计重点在于用分层模型和节点组合,让生成画面在质量和尺寸上都能得到提升。

工作流介绍

这个工作流主要围绕两个核心模型展开:首先加载 DreamShaper_8_pruned.safetensors 用于初始图像生成,随后切换到 v1-5-pruned-emaonly-fp16.safetensors 来完成二次采样和增强,从而结合两者的优势,得到高质量且逼真的结果。在模型的支持下,工作流依靠多个 Node 节点协同完成,包括 EmptyLatentImage 负责建立潜空间输入,CLIPTextEncode 分别对正向与负向提示词进行编码,KSampler 执行采样生成,LatentUpscaleBy 进行潜空间图像放大,而 VAEDecode 则将潜空间结果解码成最终图像并通过 SaveImage 保存。整体流程通过这些节点的有机组合,实现了从文本到图像再到高分辨率图像的完整链路。

在这里插入图片描述

核心模型

在整个工作流中,模型的选择与切换起到至关重要的作用。初始的 DreamShaper 模型以更具艺术感和表现力的生成见长,而 v1-5 模型则保证了稳定扩散在细节还原和真实感方面的优势。这种双模型的结合让生成的图像既有创意风格,又能在放大环节保持清晰度和真实感。

模型名称 说明
DreamShaper_8_pruned.safetensors 用于第一阶段图像生成,具有较强的艺术表现力
v1-5-pruned-emaonly-fp16.safetensors 用于第二阶段再采样和增强,保证细节和稳定性

Node节点

节点是整个工作流的骨架,承载着从潜空间创建到提示词编码,再到采样与解码的关键环节。CheckpointLoaderSimple 用于加载不同的模型,EmptyLatentImage 生成初始潜图尺寸,CLIPTextEncode 编码提示信息以指导采样,KSampler 负责在潜空间进行扩散采样,LatentUpscaleBy 用于潜空间层级的放大,而 VAEDecode 将潜图转化为可视化图像,最终由 SaveImage 节点输出结果。多个 CLIPSetLastLayer 和不同的 CLIPTextEncode 组合,使得正负提示在不同阶段都能得到优化。整体节点配合,使工作流能从低分辨率的初始结果平滑过渡到高质量的最终作品。

节点名称 说明
CheckpointLoaderSimple 加载指定的核心模型及相关组件
EmptyLatentImage 创建潜空间图像作为生成的输入
CLIPTextEncode 编码正向与负向提示词,引导采样生成
CLIPSetLastLayer 控制 CLIP 模型使用的层数,影响语义理解
KSampler 在潜空间执行扩散采样生成图像
LatentUpscaleBy 潜空间图像放大,增强分辨率
VAEDecode 将潜空间结果解码为可见图像
SaveImage 保存最终生成的图像结果

工作流程

整个工作流程分为两大阶段。第一阶段以 DreamShaper 模型为核心,通过 EmptyLatentImage 建立潜空间输入,结合正向提示与负向提示的文本编码,再由 KSampler 进行初始采样生成,并使用 VAEDecode 将潜空间转换为低分辨率图像。随后通过 LatentUpscaleBy 在潜空间放大图像,为后续的高精度再采样提供基础。第二阶段切换至 v1-5 模型,再次利用正向与负向提示词的 CLIP 编码与 KSampler 采样生成,结合放大后的潜空间图像输入,输出更高质量的图像,并最终通过 VAEDecodeSaveImage 得到细节丰富的成品。整个流程体现了分步生成、潜空间放大和再采样的有机衔接,使图像在清晰度和细节表现上得到显著提升。

流程序号 流程阶段 工作描述 使用节点
1 模型加载 分别加载 DreamShaper 与 v1-5 模型,为不同阶段的生成提供支持 CheckpointLoaderSimple
2 潜空间创建 生成初始潜空间图像作为采样输入 EmptyLatentImage
3 文本编码 将正向与负向提示词转化为条件向量,指导生成方向 CLIPTextEncode, CLIPSetLastLayer
4 初始采样 在 DreamShaper 模型下进行采样,生成第一阶段潜图 KSampler
5 潜空间放大 将第一阶段潜图在潜空间中进行分辨率提升 LatentUpscaleBy
6 再采样 在 v1-5 模型下结合放大潜图进行二次采样,增强细节与质感 KSampler
7 解码与保存 将潜空间结果解码为图像并保存输出 VAEDecode, SaveImage

应用场景

该工作流的应用场景主要集中在需要高质量图像输出的任务中。无论是创意插画还是真实感风景生成,它都能先快速生成低分辨率的初稿,再通过潜空间放大与二次采样获取高分辨率、高细节的终稿。对于艺术创作者而言,它能保证创意的表达与细节的呈现兼顾;对于设计与宣传行业,则可以在保证画面精美度的同时,快速生成符合使用需求的高分辨率图像。整体而言,这一工作流非常适合需要在效率与质量之间找到平衡的典型用户群体。

应用场景 使用目标 典型用户 展示内容 实现效果
创意插画 快速生成有艺术感的高分辨率插画 插画师、艺术家 风格化的艺术画面 兼具创意表达与清晰细节
风景生成 生成真实感自然风景图像 摄影师、风光设计师 高精度的风景画面 画面细节丰富,色彩自然
宣传设计 高质量视觉素材生成 品牌方、设计公司 宣传海报、产品图 高分辨率成品,满足商业应用
内容创作 为多媒体内容快速提供配图 博主、自媒体创作者 文章或视频配图 高效产出,保证画面精美

开发与应用

更多 AIGC 与 ComfyUI工作流 相关研究学习内容请查阅:

ComfyUI使用教程、开发指导、资源下载

更多内容桌面应用开发和学习文档请查阅:

AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐