【图片】让你的学生开口说话！——GPTsovits文字转语音教程【碧蓝档案吧】

12月27日漏签0天

碧蓝档案吧关注：421,650贴子：10,317,399

1 2 3 4 下一页尾页
67回复贴，共4页
，跳到页

<返回碧蓝档案吧

让你的学生开口说话！——GPTsovits文字转语音教程

只看楼主收藏回复

这个比较简单，我会尽量写详细一点，包括云端训练和本地推理教程

送TA礼物

IP属地:四川

1楼2024-08-12 14:27回复

IP属地:广西

来自Android客户端2楼2024-08-12 14:32

IP属地:浙江

来自Android客户端3楼2024-08-12 14:36

lz为什么推荐使用GPTsovits进行文字转语音？
1.GPTsovits所需的训练集时长极短，仅需3到5分钟即可拥有较好的效果
2.支持多种语言/方言，目前最新的GPTsovits本地整合包和云端镜像可以支持中日英粤韩五种语言的合成
3.不会有口音，合成的语音效果更加自然
4.推理门槛低，速度快，对硬件要求低
5.模型训练快，成本低，云端训练模型成本一般而言可以控制在3元以内，一个小时左右即可出炉。如果你操作比较熟练的话，整套流程下来不会超过30分钟
由于百度贴吧发语音太糊了，所以我在此就不作出模型试听了

IP属地:四川

4楼2024-08-12 14:38

IP属地:北京

来自Android客户端7楼2024-08-12 14:40

好

IP属地:江西

8楼2024-08-12 14:42

IP属地:广东

通过百度相册上传9楼2024-08-12 14:42

本文为GPT-sovits云端训练及本地推理教学
您的电脑中需要以下内容：GPT-sovits整合包，格式工厂，阿里云盘
如果您已经获取了您想要的模型，请看本文后半截的“本地推理教程”即可。

IP属地:四川

10楼2024-08-12 14:43

顶

IP属地:安徽

来自Android客户端11楼2024-08-12 14:43

顶

IP属地:安徽

来自Android客户端12楼2024-08-12 14:44

帮顶

IP属地:辽宁

来自Android客户端13楼2024-08-12 14:48

请不要使用生成式AI合成任何与ZZ相关的内容
笔者，项目贡献者和模型作者不对软件及其创作出作品具备任何控制力, 使用软件者、传播软件导出的声音者自负全责

IP属地:四川

14楼2024-08-12 14:48

1.准备数据集：
从wiki中提取音频
a.在浏览器中输入kivo.wiki 进入
b.在角色图鉴中下载语音，注意：过短的语音不要下载（例如角色受击语音），时长大于等于24秒的不要下载。
c. 打开格式工厂，在格式工厂中选择“->WAV“，将在b步时下载的语音全部添加进去，在”输出配置“中采样率设置为44100Hz，音量为25%。点击“确定”返回首页，单击“开始”进行格式转化。
d.新建文件夹（地址不限）并重命名为说话人名字，将转化好的音频剪切过来。
e.压缩上述文件夹为zip格式，将其上传至阿里云盘（文件夹别删了，推理时要用）

IP属地:四川

15楼2024-08-12 14:54

收起回复

来了

IP属地:湖北

来自iPhone客户端16楼2024-08-12 14:58

2.云端训练
①租卡
a.浏览器输入ww

w.au

todl.c

om，回车。点击右上角“登陆”，微信登陆，扫码关注公众号，完成登陆/注册
b.充值，一般3~5元就够了
c.点击上方的“算力市场”，租一张卡，优先级为3090>4090D>4090>其他显存在24G及以上的显卡，都没有的话就再等等吧，一般而言晚上的卡会多一点。
d.点击租卡，GPU数量选择1，镜像选择社区镜像，GPT-SoVITS语音合成官方镜像，镜像版本选最新的就行。等待开机。（本楼图片是我于5.5截的，最新镜像应该是8.7号更新的那个）

IP属地:四川

17楼2024-08-12 14:59

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

火爆开测more

1 2 3 4 下一页尾页
67回复贴，共4页
，跳到页

<返回碧蓝档案吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

让你的学生开口说话！——GPTsovits文字转语音教程

登录百度账号

扫二维码下载贴吧客户端

火爆开测more