前言

        本文面向(中国大陆、Windows系统、英伟达显卡)想要创作更精美、更多样化AI内容的用户,属于AI创作的新手准备工作教学。文中所有需要下载安装的内容均来自官网链接,无群聊链接或网盘链接。由于法规限制,部分教学内容恕不能展示。

        实际操作直接跳转到“正文”章节。

        基本功能:AI画图(文生图),文生视频,文生矢量图,文生3D模型,文生音频,文生“音画同步”视频,AI视频编辑,扩图,修复图片/视频,图生图,图生视频,图生3D模型等

        次级组合功能:物品图片转产品宣传图/多角度九宫格朋友圈,建筑图片转手工模型图片,人物图片转建模与3D打印模型图片等,唯独想象力会限制功能。

本文主要内容包括:

1.

2.ComfyUI的安装与初识、模型下载

3.第一次运行前的全部准备工作

本文不包括:

1.翻墙的教学

2.进阶创作教学

3.具体节点或参数

为什么用ComfyUI?

        因为一些社交媒体平台/手机端AI聊天软件自带的创作功能有限而失真,审核严苛。

A:茶余饭后画着玩(手机端 豆包、元宝、即梦绰绰有余)

B:宣传图级别精细的、风格多样的创作(电脑端 绘世启动器等)

C:将“多图、视频、音频”作为参考输入,创作图片、视频、音频、3D模型、矢量图;为创作设定工作流程,流水线式“分步骤、多批次”创作(选ComfyUI就对了,前两者好比老头乐、改装赛车,而这是方程式,虽然上手难度高,但有大量现成模板。粥有粥的改枪码,它有它的json,一键应用出装即可)

哪家生成式AI性能更好?

        ComfyUI与前两者不是同类,相互比较性能是无意义的。前两者算生产AIGC的机器,有“性能、风格、可定制灵活度”的差异,而ComfyUI算是可以部署各种创作机器的一条条流水线,对提示词、参考图等原材料进行多步加工。

        对于想尝试各种AIGC而不想搞太复杂的大多数用户,可以以ComfyUI为入口,浏览各种预制的“工作流”并直接上手创作。

工作流有什么用?

        例如,从“模板”界面里选择“图生建筑模型”工作流,先输入某建筑航拍图,输入提示词“生成其结构图(略)”,再将中间产物“结构图”作为参考图,与提示词“生成木制模型(略)”一并输入下一环节,生成一幅“墙上挂着结构图、桌上有木制建筑手工”的图片。对于这种细节,单次文生图可能难以胜任。

        近期大火的特效:“人物变成3D打印模型放在办公桌上、背景电脑屏幕上是3D建模”也是同理,将风格与主题截然不同的内容“模型”与“建模软件界面”通过分段创作融合到一起,并调整构图与景深等镜头语言。

(上图来自网络)


正文

        1~3步互不冲突,要节省下载时间可以同时做

1.安装ComfyUI

https://www.comfy.org/zh-cn/downloadhttps://www.comfy.org/zh-cn/download        建议使用默认安装设置

2.安装✞︎🏱︎☠︎

        💧︎⧫︎□︎◻︎ ⬥︎♋︎⬧︎⧫︎♓︎■︎♑︎ ⍓︎□︎◆︎❒︎ ⧫︎♓︎❍︎♏︎ ♎︎♏︎♍︎□︎♎︎♓︎■︎♑︎📪︎ ♑︎□︎■︎■︎♋︎ ♐︎♓︎■︎♎︎ ♋︎ ⧫︎◆︎⧫︎□︎❒︎♓︎♋︎●︎ ♋︎♌︎□︎◆︎⧫︎ ❖︎◻︎■︎✍︎ 👌︎♏︎⧫︎⧫︎♏︎❒︎ ⧫︎◆︎❒︎■︎ ⧫︎□︎ ⍓︎□︎◆︎❒︎ ♒︎□︎❍︎♓︎♏︎ ⬥︎♒︎□︎ ♋︎♍︎❑︎◆︎♓︎❒︎♏︎♎︎ ⧫︎♒︎♓︎⬧︎ ⬧︎🙵♓︎●︎●︎ ♓︎■︎ □︎❒︎♎︎♏︎❒︎ ⧫︎□︎ ⬥︎♋︎⧫︎♍︎♒︎ ♐︎□︎❒︎♏︎♓︎♑︎■︎ ⧫︎♓︎⧫︎⬧︎📬︎

        其目的是登录ComfyUI账号以及下载模型,选亚洲国家均可

        这里没有教程,建议向身边懂行的人寻求帮助

3.订阅流量

        购买2元100G/月(仅作参考)最低规格的套餐即可,结合上述第二步,完成配置

注意,在不使用✞︎🏱︎☠︎时,先关闭服务再退出软件。使用期间,避免浏览或发布涉政涉密内容。

4.(建议)安装迅雷

        用于加快下载大文件的速度,详见下文


接下来是ComfyUI内部的操作。

5.下载模型等文件

以“对视频进行AI编辑”的需求为例,讲解挑选模板与下载所需文件的方法,不需要照做。

挑选自己需要的“工作流”模板,通常其封面是由其内部初始提示词生成的,直接点击运行会得到与封面相似的内容。

遇到“缺少模型”警告:

        如下图,直接下载可能要一整天时间,点击“复制链接”并粘贴到迅雷下载,下载完成后将文件移动到对应文件夹内,移错了会导致ComfyUI识别不了,仍然提示“缺少模型”。

图为某个工作流加载时,遇到典型的缺少多个文件的情况。

判断该移到哪个文件夹:

        如上图所示,路径左侧就是它们各自的类型,有diffusion_models / vae / text_encoders

一般来说,潜在扩散模型含有三个组件:

  • a text encoder 文本编码器,这里主要指基于CLIP的文本编码器
  • an autoencoder 自编码器,这里主要指Variational Auto Encoder,也被简称为VAE
  • A Unet 扩散模型

摘录于:

https://zhuanlan.zhihu.com/p/680103276https://zhuanlan.zhihu.com/p/680103276

        相当于流水线(当前工作流)上所有“创作机器”所缺少的零件。不同工作流可以复用相同的“创作机器”,你无需多次下载。

        默认安装设置下,ComfyUI的模型文件放置路径如下图所示:

        例如,某千问工作流所需的diffusion_models文件在下载完毕后,从迅雷下载地址剪切到对应文件夹中,如下图所示。

        回到ComfyUI,点击刷新,就能看到操作成功。


6.接下来是具体某个工作流里的操作

        ComfyUI内部,右上角,先登录并充值:(用尽后会像公交卡一样扣成负的;对于文生图,一美元就能跑好几次)

        每个工作流都不同,但基本都有下图这样包含一大段英文的框,右上角还明码标价跑一次0.168美元,这个框里就是提示词部分,把需求翻译成英文填进去,通常要英文,除非强调了支持中文(可以交给豆包、deepseek之类大语言模型让它们来润色)。

图为某工作流的提示词节点

        

        左边通常是要输入的视频、图片之类的素材,根据注释的引导填入对应内容。点击下方运行,等待即可,右上角会显示进度条,输入和输出文件默认在路径

C:\Users\***\Documents\ComfyUI\input

C:\Users\***\Documents\ComfyUI\output

        

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐