nekopara吧 关注:52,836贴子:145,123
  • 2回复贴,共1

赛博猫娘养成计划

取消只看楼主收藏回复

最近在看AI绘图和AI语音的东西。
想起来之前下的资源里已经有了猫娘们的语音解包,可以训练出猫娘们的语音模型;
再做出来动画模型,配合steam上面的一款数字伙伴整合上chatgpt;
还有之前看过的一个立体投影作为电脑副屏;
综合上面这些不就实现了赛博猫娘了吗╰(*°▽°*)╯。
今天打算先准备一些训练集,extra、0、1、2的语音ogg文件都已经有了,稍微改一下格式就行;
3的语音打算用Garbro解出来,4的语音打算用KrkrExtract;
但是遇到了第一个问题,语音文本怎么提取?
1、解包
我解了voice.xp3这个包,除了ogg文件还有一个对应文件名的csv文件,里面是用逗号分隔的一连串小数。我觉得这个csv和文本一定是有关系的,但是不知道怎么转换,或者说语音文本不是这个包里的。
2、ocr
可以用VNR边推边收集,但是这样工作量就会蛮大的了
希望有大佬可以帮我解决一下这个问题


IP属地:浙江1楼2023-11-30 17:00回复
    千辛万苦终于把バニラ的语音训练出来了,语音模型和config文件我传到度盘上了,需要的uu可以配合moegoe或者别的什么食用。
    链接:https://pan.baidu.com/s/1qm3l6VFRmP34-qtDWtq0MA?pwd=1of5
    提取码:1of5


    IP属地:浙江4楼2023-12-12 14:13
    回复
      2026-04-23 17:05:16
      广告
      不感兴趣
      开通SVIP免广告
      经过了近一个月的努力,把vanilla和chocola的语音vits模型、翻唱sovits模型还有lora绘画模型做出来了,chocola的sovits模型还有点问题就没传上网盘。接下来会用koikatsu2做一个vanilla的模型,做好了也会上传到网盘和创意工坊。
      链接:https://pan.baidu.com/s/1W8ErlVcmttQEn4iRE2-ZrQ?pwd=neko
      提取码:neko


      IP属地:浙江5楼2023-12-26 13:29
      回复