【图片】让你的学生开口说话！——GPTsovits文字转语音教程【碧蓝档案吧】

03月25日漏签0天

碧蓝档案吧关注：423,586贴子：10,523,658

1 2 下一页尾页
16回复贴，共2页
，跳到页

<返回碧蓝档案吧

让你的学生开口说话！——GPTsovits文字转语音教程

取消只看楼主收藏回复

这个比较简单，我会尽量写详细一点，包括云端训练和本地推理教程

送TA礼物

IP属地:四川

1楼2024-08-12 14:27回复

lz为什么推荐使用GPTsovits进行文字转语音？
1.GPTsovits所需的训练集时长极短，仅需3到5分钟即可拥有较好的效果
2.支持多种语言/方言，目前最新的GPTsovits本地整合包和云端镜像可以支持中日英粤韩五种语言的合成
3.不会有口音，合成的语音效果更加自然
4.推理门槛低，速度快，对硬件要求低
5.模型训练快，成本低，云端训练模型成本一般而言可以控制在3元以内，一个小时左右即可出炉。如果你操作比较熟练的话，整套流程下来不会超过30分钟
由于百度贴吧发语音太糊了，所以我在此就不作出模型试听了

IP属地:四川

4楼2024-08-12 14:38

南昌眠矿州催网络科技

阿托伐他汀对肝脏有损害吗，快速在线测一下你的健康情况，35道题3分钟全面分析你的身体健康情况，阿托伐他汀对肝脏有损害吗，立即测试一下吧。

2025-03-25 16:42广告

立即查看

本文为GPT-sovits云端训练及本地推理教学
您的电脑中需要以下内容：GPT-sovits整合包，格式工厂，阿里云盘
如果您已经获取了您想要的模型，请看本文后半截的“本地推理教程”即可。

IP属地:四川

10楼2024-08-12 14:43

请不要使用生成式AI合成任何与ZZ相关的内容
笔者，项目贡献者和模型作者不对软件及其创作出作品具备任何控制力, 使用软件者、传播软件导出的声音者自负全责

IP属地:四川

14楼2024-08-12 14:48

1.准备数据集：
从wiki中提取音频
a.在浏览器中输入kivo.wiki 进入
b.在角色图鉴中下载语音，注意：过短的语音不要下载（例如角色受击语音），时长大于等于24秒的不要下载。
c. 打开格式工厂，在格式工厂中选择“->WAV“，将在b步时下载的语音全部添加进去，在”输出配置“中采样率设置为44100Hz，音量为25%。点击“确定”返回首页，单击“开始”进行格式转化。
d.新建文件夹（地址不限）并重命名为说话人名字，将转化好的音频剪切过来。
e.压缩上述文件夹为zip格式，将其上传至阿里云盘（文件夹别删了，推理时要用）

IP属地:四川

15楼2024-08-12 14:54

收起回复

2.云端训练
①租卡
a.浏览器输入ww

w.au

todl.c

om，回车。点击右上角“登陆”，微信登陆，扫码关注公众号，完成登陆/注册
b.充值，一般3~5元就够了
c.点击上方的“算力市场”，租一张卡，优先级为3090>4090D>4090>其他显存在24G及以上的显卡，都没有的话就再等等吧，一般而言晚上的卡会多一点。
d.点击租卡，GPU数量选择1，镜像选择社区镜像，GPT-SoVITS语音合成官方镜像，镜像版本选最新的就行。等待开机。（本楼图片是我于5.5截的，最新镜像应该是8.7号更新的那个）

IP属地:四川

17楼2024-08-12 14:59

收起回复

②打标
a.点击“快捷工具”中的AutoPanel，点击公网网盘，独立访问密码随便设一个。手机端APP扫码登陆阿里云盘，将你的压缩包下载下来。

单击下载
b.点击JupyterLab进入如下网页，点击左上角文件夹图标以返回根目录。进入autodl-tmp文件夹即可找到你的压缩包。

暗红色圈起来的这个

下载下来的压缩包
c.点击左上角蓝色框里的+号，在启动页一个终端，输入unzip[空格][文件名]，按回车键执行该命令。执行完毕后关闭该终端。

IP属地:四川

20楼2024-08-12 15:14

d.回到GPT-SoVITS文件夹中，点击右上角“+号”，在启动页新建一个终端（不要关闭这个终端！！！），输入指令

按回车键执行。等待运行。之后点击下面这个链接以访问webUI。

终端里下面的那个Running on public URL的链接
e. 找到之前您解压的文件夹，右键选中，点击复制路径。将其粘贴到0c栏，并在前面加上一个/root/。若训练集为中文，ASR 模型选择达摩ASR，若训练集为英语/日语，ASR模型选择Faster Whisper，ASR 模型尺寸选择large-v3，ASR 语言设置en(对应英语)/ja(对应日语)，点击开始离线ASR。该过程需要等待一段时间。在终端中可以看到已用时间和预计剩余时间，若预计时间太长，请点击终止ASR进程，并重新开始。

IP属地:四川

21楼2024-08-12 15:17