Wav2Lip环境搭建问题

这个错误表明 librosa.filters.mel 函数的签名发生了变化，现在它只接受关键字参数。我们需要修改 audio.py 文件中的 _build_mel_basis 函数，确保所有参数都以关键字形式传递（这是由librosa安装了最新版本带来的不匹配问题）迫不及待的想去results文件夹下看看效果，文件已经生成，效果还算勉强，嘴巴有点不清晰，这里就不上视频了，后续再想办法优化。我的环境

紫竹苑主

1913人浏览 · 2024-11-19 18:31:14

紫竹苑主 · 2024-11-19 18:31:14 发布

搭建环境

从github上下载源码 https://github.com/Rudrabha/Wav2Lip
下载预训练包，存放到checkpoints下面
创建必要的运行环境 conda create --name wav2lip python=3.10
安装pytorch GPU环境
pip install torch2.0.0+cu118 torchvision0.15.1+cu118 torchaudio==2.0.1+cu118 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.mirrors.ustc.edu.cn/simple/
验证cuda环境安装成功
环境创建问题请参考我关于环境问题的笔记，例如 AI项目运行环境问题
运行环境依赖包

导航到requirements文件目录，执行pip install 命令

安装成功后

运行程序
python inference.py --checkpoint_path checkpoints\wav2lip_gan.pth --face inputs\video\origianl_video.mp4 --audio inputs\audio\man.wav
开始运行。。。。。。
执行后报错如下：
Traceback (most recent call last):
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\inference.py”, line 280, in
main()
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\inference.py”, line 225, in main
mel = audio.melspectrogram(wav)
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\audio.py”, line 47, in melspectrogram
S = _amp_to_db(_linear_to_mel(np.abs(D))) - hp.ref_level_db
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\audio.py”, line 95, in _linear_to_mel
_mel_basis = _build_mel_basis()
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\audio.py”, line 100, in _build_mel_basis
return librosa.filters.mel(hp.sample_rate, hp.n_fft, n_mels=hp.num_mels,
TypeError: mel() takes 0 positional arguments but 2 positional arguments (and 3 keyword-only arguments) were given

这个错误表明 librosa.filters.mel 函数的签名发生了变化，现在它只接受关键字参数。我们需要修改 audio.py 文件中的 _build_mel_basis 函数，确保所有参数都以关键字形式传递（这是由librosa安装了最新版本带来的不匹配问题）
找到提示中对应的代码，添加参数传递，修改如下图
在这里插入图片描述
重新执行一下运行命令即可顺畅运行。
我直接使用了PyCharm运行结果如下：
写文章的功夫都快跑完了，还是蛮快的，嘻嘻！
还是不省心，100%临门一脚还是报错了，好吧！

根据提示numpy降级到一个比较稳定的版本
pip uninstall numpy
pip install numpy==1.23.5
再次用命令行运行
在这里插入图片描述
总算成功了！
迫不及待的想去results文件夹下看看效果，文件已经生成，效果还算勉强，嘴巴有点不清晰，这里就不上视频了，后续再想办法优化

我的环境实在有点多，如果用不着就可以删除没用的环境
可以用如下命令：
conda deactivate
删除环境： conda env remove --name wav2lib_GPFGAN
最后记得情况conda缓存： conda clean --all
本环境暂时保留，等写完优化笔记再处理！嘎嘎！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

国密加密整理

ECC 256位（SM2采用的就是ECC 256位的一种）安全强度比RSA 2048位高，但运算速度快于RSA。CBC：是一种循环模式（链式），前一个分组的密文和当前分组的明文操作后再加密，这样做的目的是增强破解难度。ECB：是一种基础的加密方式，密文被分割成分组长度相等的块（不足补齐），然后单独一个个加密，一个个输出组成密文。CBC模式：1、不容易主动攻击,安全性好于baiECB,适合传输长度长