碧蓝档案吧 关注:421,650贴子:10,317,399

让你的学生开口说话!——GPTsovits文字转语音教程

只看楼主收藏回复

这个比较简单,我会尽量写详细一点,包括云端训练和本地推理教程


IP属地:四川1楼2024-08-12 14:27回复


    IP属地:广西来自Android客户端2楼2024-08-12 14:32
    回复
      cy


      IP属地:浙江来自Android客户端3楼2024-08-12 14:36
      回复
        lz为什么推荐使用GPTsovits进行文字转语音?
        1.GPTsovits所需的训练集时长极短,仅需3到5分钟即可拥有较好的效果
        2.支持多种语言/方言,目前最新的GPTsovits本地整合包和云端镜像可以支持中日英粤韩五种语言的合成
        3.不会有口音,合成的语音效果更加自然
        4.推理门槛低,速度快,对硬件要求低
        5.模型训练快,成本低,云端训练模型成本一般而言可以控制在3元以内,一个小时左右即可出炉。如果你操作比较熟练的话,整套流程下来不会超过30分钟
        由于百度贴吧发语音太糊了,所以我在此就不作出模型试听了


        IP属地:四川4楼2024-08-12 14:38
        回复


          IP属地:北京来自Android客户端7楼2024-08-12 14:40
          回复


            IP属地:江西8楼2024-08-12 14:42
            回复


              IP属地:广东通过百度相册上传9楼2024-08-12 14:42
              回复
                本文为GPT-sovits云端训练及本地推理教学
                您的电脑中需要以下内容:GPT-sovits整合包,格式工厂,阿里云盘
                如果您已经获取了您想要的模型,请看本文后半截的“本地推理教程”即可。


                IP属地:四川10楼2024-08-12 14:43
                回复


                  IP属地:安徽来自Android客户端11楼2024-08-12 14:43
                  回复


                    IP属地:安徽来自Android客户端12楼2024-08-12 14:44
                    回复
                      帮顶


                      IP属地:辽宁来自Android客户端13楼2024-08-12 14:48
                      回复
                        请不要使用生成式AI合成任何与ZZ相关的内容
                        笔者,项目贡献者和模型作者不对软件及其创作出作品具备任何控制力, 使用软件者、传播软件导出的声音者自负全责


                        IP属地:四川14楼2024-08-12 14:48
                        回复
                          1.准备数据集:
                          从wiki中提取音频
                          a.在浏览器中输入kivo.wiki 进入
                          b.在角色图鉴中下载语音,注意:过短的语音不要下载(例如角色受击语音),时长大于等于24秒的不要下载。
                          c. 打开格式工厂,在格式工厂中选择“->WAV“,将在b步时下载的语音全部添加进去,在”输出配置“中采样率设置为44100Hz,音量为25%。点击“确定”返回首页,单击“开始”进行格式转化。
                          d.新建文件夹(地址不限)并重命名为说话人名字,将转化好的音频剪切过来。
                          e.压缩上述文件夹为zip格式,将其上传至阿里云盘(文件夹别删了,推理时要用)



                          IP属地:四川15楼2024-08-12 14:54
                          收起回复
                            来了


                            IP属地:湖北来自iPhone客户端16楼2024-08-12 14:58
                            回复
                              2.云端训练
                              ①租卡
                              a.浏览器输入www.autodl.com,回车。点击右上角“登陆”,微信登陆,扫码关注公众号,完成登陆/注册
                              b.充值,一般3~5元就够了
                              c.点击上方的“算力市场”,租一张卡,优先级为3090>4090D>4090>其他显存在24G及以上的显卡,都没有的话就再等等吧,一般而言晚上的卡会多一点。
                              d.点击租卡,GPU数量选择1,镜像选择社区镜像,GPT-SoVITS语音合成官方镜像,镜像版本选最新的就行。等待开机。(本楼图片是我于5.5截的,最新镜像应该是8.7号更新的那个)


                              IP属地:四川17楼2024-08-12 14:59
                              收起回复