Wav2Lip环境搭建问题
这个错误表明 librosa.filters.mel 函数的签名发生了变化,现在它只接受关键字参数。我们需要修改 audio.py 文件中的 _build_mel_basis 函数,确保所有参数都以关键字形式传递(这是由librosa安装了最新版本带来的不匹配问题)迫不及待的想去results文件夹下看看效果,文件已经生成,效果还算勉强,嘴巴有点不清晰,这里就不上视频了,后续再想办法优化。我的环境
搭建环境
-
从github上下载源码 https://github.com/Rudrabha/Wav2Lip
-
下载预训练包,存放到checkpoints下面
-
创建必要的运行环境 conda create --name wav2lip python=3.10
-
安装pytorch GPU环境
pip install torch2.0.0+cu118 torchvision0.15.1+cu118 torchaudio==2.0.1+cu118 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.mirrors.ustc.edu.cn/simple/
验证cuda环境安装成功
环境创建问题请参考我关于环境问题的笔记,例如 AI项目运行环境问题 -
运行环境依赖包
导航到requirements文件目录,执行pip install 命令
安装成功后
运行程序
python inference.py --checkpoint_path checkpoints\wav2lip_gan.pth --face inputs\video\origianl_video.mp4 --audio inputs\audio\man.wav
开始运行。。。。。。
执行后报错如下:
Traceback (most recent call last):
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\inference.py”, line 280, in
main()
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\inference.py”, line 225, in main
mel = audio.melspectrogram(wav)
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\audio.py”, line 47, in melspectrogram
S = _amp_to_db(_linear_to_mel(np.abs(D))) - hp.ref_level_db
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\audio.py”, line 95, in _linear_to_mel
_mel_basis = _build_mel_basis()
File “D:\Chenyan\Learn\AICode\Wav2Lip\Wav2Lip-master\audio.py”, line 100, in _build_mel_basis
return librosa.filters.mel(hp.sample_rate, hp.n_fft, n_mels=hp.num_mels,
TypeError: mel() takes 0 positional arguments but 2 positional arguments (and 3 keyword-only arguments) were given
这个错误表明 librosa.filters.mel 函数的签名发生了变化,现在它只接受关键字参数。我们需要修改 audio.py 文件中的 _build_mel_basis 函数,确保所有参数都以关键字形式传递(这是由librosa安装了最新版本带来的不匹配问题)
找到提示中对应的代码,添加参数传递,修改如下图
重新执行一下运行命令即可顺畅运行。
我直接使用了PyCharm运行结果如下:
还是不省心,100%临门一脚还是报错了,好吧!
根据提示numpy降级到一个比较稳定的版本
pip uninstall numpy
pip install numpy==1.23.5
再次用命令行运行
总算成功了!
迫不及待的想去results文件夹下看看效果,文件已经生成,效果还算勉强,嘴巴有点不清晰,这里就不上视频了,后续再想办法优化
我的环境实在有点多,如果用不着就可以删除没用的环境
可以用如下命令:
conda deactivate
删除环境: conda env remove --name wav2lib_GPFGAN
最后记得情况conda缓存: conda clean --all
本环境暂时保留,等写完优化笔记再处理!嘎嘎!
更多推荐
所有评论(0)