FaceFusion:行业领先的开源免费换脸平台,视频换脸原来可以这么简单


这个工具到底是什么

FaceFusion 是一个托管在 GitHub 上的开源 AI 换脸项目,目前已经更新到 3.x 版本,GitHub 累计获得近 20K Star,在开源社区里算是关注度相当高的工具了。

它的定位很清楚:下一代人脸交换与增强系统。不只是简单的换脸贴图,而是走的"感知—对齐—迁移—融合"这一套完整链条。换出来的脸不会像早年工具那样有明显的边缘拼接痕迹,整体自然度比老版 Roop 要强不少。

官方说法是"领先的工业级 AI 换脸系统",这话有没有夸大成分另说,但从 GitHub 的 Star 数量和社区讨论热度来看,这款工具确实在这个赛道里站住了脚。


在这里插入图片描述

核心功能有哪些

换脸处理器
支持图片和视频两种媒体格式的人脸替换。视频处理支持批量多帧处理,不需要一帧一帧手动操作。

人脸增强(face_enhancer)
换完脸之后可以对脸部做二次修复,提升清晰度,避免换脸后出现模糊或马赛克感。

帧增强(frame_enhancer)
对整个画面帧进行增强处理,不只是脸部,适合输入素材质量较差的情况。

Pixel Boost
3.0 版本加入的功能,专门用来提升换脸后的边缘细节清晰度,处理结果更细腻。

口型同步(wave2lip)
引入了 wave2lip 处理器,可以让换上去的脸和原视频的口型动作保持同步。做配音类视频或者数字人视频时这个功能很实用。

Live Portrait 表情控制
3.0 版本新增,可以通过驱动图或视频来控制目标人物的表情动作,相当于做一个简易数字人。

实时直播换脸
3.0 版本支持直播场景下的实时人脸替换,延迟有所控制,用于娱乐直播可以玩。

年龄调节处理器
可以对面部做年龄方向的调整,这个在广告或短视频内容里有一定使用场景。

多人脸支持
单个项目里可以同时对多张人脸进行替换,不用分开跑多次。

局部换脸
可以指定只替换脸的某个区域,比如单独换眼睛、嘴巴、鼻子,或者只换上半脸或下半脸。这个精细控制在某些特定场景下确实好用。


在这里插入图片描述

需要什么硬件

这里直接说实际情况,不做过多美化。

GPU 是硬性需求

FaceFusion 对显卡有明确依赖。支持三种执行方式:

  • CUDA(NVIDIA 显卡专用,性能最好)
  • TensorRT(NVIDIA 显卡的进阶加速模式,显存占用更低,速度更快)
  • CPU(所有设备都能跑,但速度很慢)

实测数据参考:在 NVIDIA RTX 3070 上,单帧高清图像处理时间在 0.15 秒以内,一段 7 秒的视频不开 TensorRT 加速也只需要约 4 秒完成。如果用 CPU 跑,同样的内容可能要等好几分钟。

推荐配置

配置项 基础可用 推荐配置
显卡 NVIDIA GTX 1060(6GB显存) RTX 3070 及以上
显存 6GB 8GB 以上
内存 16GB 32GB
系统 Windows 10 / Linux Windows 11 / Ubuntu
Python 3.10+ 3.10+

AMD 显卡也支持(ROCm),但目前社区反馈在 Windows 下 AMD 显卡的兼容性问题会多一些,Linux 下相对稳定。

苹果 M 系列芯片也有支持,走 CoreML 执行,但处理速度和 NVIDIA 有差距。

安装方面

官方提供 GitHub 源码和付费安装包两种方式。习惯命令行的人可以直接拉源码,不熟悉的建议用社区整合包,省去配置 Conda 环境的麻烦。Python 版本建议 3.10 以上,用 Conda 管理环境会顺很多。


和其他同类工具的对比

市面上常见的开源换脸工具主要有这几个:FaceFusion、DeepFaceLab、Roop(Roop-Unleashed)、Rope。下面逐一对比。

FaceFusion vs DeepFaceLab

DeepFaceLab 出现得早,是以前做高质量换脸的主流工具,电影级 deepfake 基本都用它。但它的操作流程比较繁琐,需要重新截取人脸、训练模型,整个流程走下来对新手不友好,时间成本高。硬件方面,DeepFaceLab 只需要 2GB 显存就能跑,门槛低,但处理质量和速度跟不上需求。

FaceFusion 走的是预训练模型直接推理的路子,不需要训练,上传源脸和目标脸直接出结果。效率比 DeepFaceLab 高很多,适合批量出内容的场景。DeepFaceLab 只有本地安装版,FaceFusion 在部分云端平台也有在线版本可以用。

FaceFusion vs Roop

Roop 是早期很火的工具,操作简单,但后续更新停了,漏洞和效果问题没人维护。Roop-Unleashed 是社区的延续版,功能上补了一些,但整体完成度还是不如 FaceFusion。

FaceFusion 从代码结构上做了模块化重构,功能集成度更高,支持的处理器和模型更多,更新频率也更稳定。论坛上有人说 Roop 是"起点",FaceFusion 是"现在能用的"。

FaceFusion vs Rope

Rope 的自动遮罩模型是亮点,能智能识别发际线和手等遮挡物,提高换脸自然度。但 Rope 对硬件要求比 FaceFusion 更高,建议 NVIDIA 2060 以上才能流畅运行,低配设备跑起来很费劲。

对于配置一般的机器,FaceFusion 的适应性更好。Rope 适合对遮挡处理要求高的精细场景。

汇总对比表

对比项 FaceFusion DeepFaceLab Roop Rope
是否开源免费
需要训练模型 ❌ 不需要 ✅ 需要
操作难度
显存要求 6GB+ 2GB+ 4GB+ 8GB+
视频支持
实时直播换脸 ✅(3.0新增)
口型同步
多人脸支持 有限
更新维护 持续更新 较少更新 停止维护 有更新
社区活跃度

一键整合包

下载地址:
链接: https://pan.baidu.com/s/1pDywlhsrJXCoUdPJG_iIng?pwd=8888 提取码: 8888

安装方式:下载后,选择文件夹中的所有文件(约14G),右键选择“7-Zip” => “Extract Here”,解压完成后,双击压缩包中的 “启动.bat” 文件即可启动程序。如果想要自行进行安装,继续查看“安装应用”小节。

安装应用

系统要求:支持 Linux/macOS/Windows,支持 cpu/cuda/tensorrt。 下面以 Windows11 为例,演示安装流程。在 cmd 中依次输入以下命令

cd D:\ai\self_use_package // 选择软件安装的目标目录
git clone https://github.com/facefusion/facefusion.git // 下载源码
cd facefusion // 进入源码目录
conda create -n facefusion python=3.12 -y // 创建虚拟环境
conda activate facefusion // 激活虚拟环境
conda install conda-forge::cuda-runtime=12.4.1 conda-forge::cudnn=9.2.1.18 // 安装 cuda/cudnn
pip install tensorrt==10.6.0 --extra-index-url https://pypi.nvidia.com // 安装 tensorrt,支持高性能的N卡
python install.py --onnxruntime cuda --skip-conda // 安装项目依赖

启动应用


python facefusion.py run --open-browser // 启动程序

在 cmd 中看到如下日志,表示成功(首次启动会从 HuggingFace 上拉取模型)

Running on local URL:  http://127.0.0.1:7860

此时浏览器输入 http://127.0.0.1:7860,展示界面如下
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐