lz为什么推荐使用GPTsovits进行文字转语音?
1.GPTsovits所需的训练集时长极短,仅需3到5分钟即可拥有较好的效果
2.支持多种语言/方言,目前最新的GPTsovits本地整合包和云端镜像可以支持中日英粤韩五种语言的合成
3.不会有口音,合成的语音效果更加自然
4.推理门槛低,速度快,对硬件要求低
5.模型训练快,成本低,云端训练模型成本一般而言可以控制在3元以内,一个小时左右即可出炉。如果你操作比较熟练的话,整套流程下来不会超过30分钟
由于百度贴吧发语音太糊了,所以我在此就不作出模型试听了