Skip to content

【SVC-Fusion1.1.1】部署教程

SVC-Fusion1.1.1介绍

SVC-Fusion1.1.1 : 开箱即用的 AI 翻唱音频工具箱

图片1

SVC-Fusion 是一款开箱即用的 AI 翻唱音频工具箱,核心定位为 “低门槛、多功能”,面向小白用户且无需显卡即可训练,其功能特征可从「核心定位与优势」「支持的 AI 模型」「关键功能特性」「一站式工具集」四大维度展开

主要功能特征

功能类别具体功能价值说明
硬件适配50 系 N 卡支持兼容新一代 N 卡,提升硬件利用率
AMD 显卡支持打破 “仅支持 NVIDIA 显卡” 限制,覆盖更多用户
模型定制自定义底模支持用户根据需求替换基础模型,提升个性化程度
自定义声码器可更换声码器类型,优化音频输出音色
音频处理音区偏移调整音频音调范围,适配不同声线需求
内置离线分离无需联网即可分离人声与伴奏,提升使用灵活性
自动混音自动优化多音频轨道混合效果,减少手动操作
实时功能实时变声器支持即时语音转换,可用于直播、互动等场景
声码器变调通过声码器精准调整音调,保持音频自然度
系统管理完整的模型管理系统统一管理已安装 / 训练的模型,方便切换与维护

1. 前置准备

1.1 创建实例

2.png

选择配置后,在镜像市场中搜索SVC,即可找到SVC-Fusion-v1.1.1-Win,点击立即创建

1.2 添加音频

在选择好分区后,将本地的音频素材直接拖动到网盘中

1.3 启动JupyterLab,并打开程序

打开后点击 + 号,再点击终端,输入以下指令

linux
cd /root/svc-fusion
source env/bin/activate && python -V && python launcher.py

启动完成后按下图所示操作

回到JupyterLab界面,按如图所示操作

1.先将路径选择至dataset_raw,右键创建文件夹,再在终端窗口执行 指令

cp /mnt/storage/1.wav /root/svc-fusion/dataset_raw/所创建文件夹名称


2.SVC-Fusion1.1.1演示

访问localhost:7860,即可看到该页面(运行完成后也会自动跳转)

此教程以演示模型DDSP SVC 6.0为主

2.1数据处理

  1. 选择数据处理tab页,选择模型为DDSP SVC 6.0,点击开始预处理

如下图所示,即预处理完成

2.选择训练tab页修改配置,点击开始/继续训练

如图所示即训练完成

3.点击推理tab页点击加载模型弹出说话人即可

4.点击小工具tab页,点击打包模型即可,在打包结果上下载即可得到训练好的模型

注:以下为镜像师使用教程视频链接

【SVC-Fusion】无需显卡,免费训练自己的声音模型