Skip to content

【GPT-sovits】使用教程

镜像介绍:

GPT-sovits 不仅仅是一个工具;它是语音技术的一项突破,带来了多项创新功能。

零样本 TTS:未来展望

  • **即时语音克隆:**借助零样本 TTS,GPT-sovits 只需使用任何语音的 5 秒样本即可进行文本到语音的转换。此功能类似于在快照中捕捉声音的本质,然后用该声音将书面文字变为现实,而这一切都不需要大量训练数据。

小样本 TTS:用最少的数据创造真实感

  • **增强语音相似度:**GPT-sovits 的少样本 TTS 功能仅通过1 分钟的语音数据训练模型,可以实现非凡的语音相似度和真实度。这对于创建个性化语音助手、有声读物或任何以语音独特性为关键的应用程序尤其有益。

跨语言支持:打破语言障碍

  • **多语言推理:**GPT-sovits 的一大特点是能够使用不同于训练数据集的语言进行推理。目前已支持英语、日语和中文等主要语言。这种跨语言支持为全球交流和内容创作开辟了无限可能,使其成为全球用户的多功能工具。

集成的 WebUI 工具:赋能创作者

  • **语音伴奏分离:**将人声与背景音乐隔离,更容易创建干净的训练数据集。

  • **自动训练集分割:**通过自动分割语音数据简化训练集的创建。

  • **中文 ASR 和文本标注:**这些功能可帮助用户转录和标注中文语音数据,促进TTS 模型的中文支持训练。

    这些功能共同使 GPT-Sovits 成为任何想要探索语音技术前沿的人(从业余爱好者和内容创作者到该领域的研究人员和专业人士)的综合解决方案。

使用教程

1、准备工作

设置 GPT-Sovits 需要根据您的操作系统进行特定准备。

以下是分步指南,可确保您已准备好使用 GPT-SoVITS 进入高级语音合成的世界。

系统硬解要求

训练: 1.Windows10/11操作系统,支持 CUDA 的 NVIDIA 显卡,8G以上显存; 2.macOS 12.3或更高版本,搭载Apple芯片(M系列芯片)或AMD GPU的Mac 推理: 1.Windows10/11操作系统,支持 CUDA 的 NVIDIA 显卡,4G以上显存; 2.macOS 12.3或更高版本,搭载Apple芯片(M系列芯片)或AMD GPU的Mac

Docker 部署对于系统硬解方面的要求相同。

但通过星海智算平台进行云部署,无需考虑以上,我们提供一键部署的优质运行环境。

2、注册算力云平台:星海智算

https://gpu.spacehpc.com/

3、选择区域并选择合适的显卡,根据准备工作里的需求,我们这里选择V100

4、在镜像市场,点击更换镜像,选择GPT-sovits,确认后在实例创建页面点击<立刻创建>即可

5、创建成功等待4-5分钟,看到<运行中>即可开始使用。

6、点击“JupyterLab”进入终端操作界面