首先需要声明的一点就是V1的模型能用在V2上面,但是V2的模型不能用在V1上,并且V1模型在V2上效果不佳!
整合包下载地址:

都放网盘里了,点击这里下载

下面教大家怎么使用

1.自动填充路径
2.funasr增加粤语,whisper增加韩语和粤语标注功能。funasr的粤语标注更为准确

3.whisper可选推理精度,float16可以带来更快的推理速度

预处理:
1.中文改为G2PW处理以优化多音字效果,但处理速度变慢了

2.优化了英文多音字效果,处理速度也变快了

训练:
1.全新底膜,训练集增加到5k小时

2.增加韩粤两种语言

3.训练所需数据集更少

推理:
1.zero shot效果大幅增强

2.中日英韩粤5个语种均可跨语种合成

3.对低音质参考音频合成出来音质更好

4.更好的文本前端,中英文加入多音字优化

5.增加语速调节

6.增加音色融合

以上具体的更新内容来自官方给出的信息,这些内容也在后来我使用V2推理得到了验证,其实使用V2和V1并没有什么区别,WEBUI就多了一个降噪功能,其他的都一样。

接下来让我们教大家如何在V2中训练出自己的模型吧。
在这里插入图片描述
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐