ndexTTS 是一种主要基于 XTTS 和 Tortoise 的 GPT 风格的文本转语音 (TTS)模型。它能够使用拼音纠正汉字的发音,并通过标点符号控制任意位置的停顿。它增强了系统的多个模块,包括改进扬声器条件特征表示,以及集成 BigVGAN2以优化音频质量。此系统经过数万小时的数据训练,实现了最先进的性能,优于当前流行的 TTS 系统,如 XTTS、CosyVoice2、Fish-Speech 和 F5-TTS等。

1.下载并安装Conda

下载地址:Download Success | Anaconda

选Miniconda

运行安装包,按提示点击下一步,当出现下面界面时,将第2项勾选,然后按提示进行操作,直至安装结束。

2.准备安装文件夹

例如:d:\tts

3.下载index-tts zip压缩包

下载地址:https://github.com/index-tts/index-tts

下载 index-tts-main.zip并解压,将解压后的文件夹复制到安装文件夹 d:\tts 下面

主程序文件夹为:D:\tts\index-tts-main

4.创建环境

增加环境路径并将其优先级设为最高:

conda config --prepend envs_dirs "d:\tts"

创建环境

conda create -n "index-tts-env" python=3.10

激活环境

conda activate "index-tts-env"

5.下载提速设置

将下载地址设为清华大学镜像服务器

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

pip config set global.trusted-host pypi.tuna.tsinghua.edu.cn

6.安装indexTTS所依赖的程序包

conda install -c conda-forge pynini==2.1.6

pip install -e ".[webui]"

7.下载模型

下载地址:

IndexTeam/IndexTTS-1.5 at main

将下载的文件复制到:

D:\tts\index-tts-main\checkpoints 文件夹下

8.进行测试

浏览器地址栏:

http://127.0.0.1:7860/

9.安装gpu版本的pytorch

安装代码产生地址:Get Started

下面是cuda 11.8版本,建议GTX10、GTX 20系列显列使用:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

下面是最新的cuda 12.9版本,建议GTX30系列以上的显卡使用:

pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu129

10.进行测试

浏览器地址栏:

http://127.0.0.1:7860/

11.创建批处理文件,go.bat,内容如下:

@echo off

echo 正在启动 IndexTTS 文本转语音 ...

REM 激活conda环境

call conda activate index-tts-env

REM 检查环境是否成功激活

if errorlevel 1 (

echo 无法激活conda环境: index-tts-env

goto :end

)

REM 执行Python脚本

python webui.py

REM 检查脚本是否成功执行

if errorlevel 1 (

echo Python脚本执行失败

) else (

echo Python脚本执行完成

)

:end

pause

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐