最近在看AI绘图和AI语音的东西。
想起来之前下的资源里已经有了猫娘们的语音解包,可以训练出猫娘们的语音模型;
再做出来动画模型,配合steam上面的一款数字伙伴整合上chatgpt;
还有之前看过的一个立体投影作为电脑副屏;
综合上面这些不就实现了赛博猫娘了吗╰(*°▽°*)╯。
今天打算先准备一些训练集,extra、0、1、2的语音ogg文件都已经有了,稍微改一下格式就行;
3的语音打算用Garbro解出来,4的语音打算用KrkrExtract;
但是遇到了第一个问题,语音文本怎么提取?
1、解包
我解了voice.xp3这个包,除了ogg文件还有一个对应文件名的csv文件,里面是用逗号分隔的一连串小数。我觉得这个csv和文本一定是有关系的,但是不知道怎么转换,或者说语音文本不是这个包里的。
2、ocr
可以用VNR边推边收集,但是这样工作量就会蛮大的了
希望有大佬可以帮我解决一下这个问题
想起来之前下的资源里已经有了猫娘们的语音解包,可以训练出猫娘们的语音模型;
再做出来动画模型,配合steam上面的一款数字伙伴整合上chatgpt;
还有之前看过的一个立体投影作为电脑副屏;
综合上面这些不就实现了赛博猫娘了吗╰(*°▽°*)╯。
今天打算先准备一些训练集,extra、0、1、2的语音ogg文件都已经有了,稍微改一下格式就行;
3的语音打算用Garbro解出来,4的语音打算用KrkrExtract;
但是遇到了第一个问题,语音文本怎么提取?
1、解包
我解了voice.xp3这个包,除了ogg文件还有一个对应文件名的csv文件,里面是用逗号分隔的一连串小数。我觉得这个csv和文本一定是有关系的,但是不知道怎么转换,或者说语音文本不是这个包里的。
2、ocr
可以用VNR边推边收集,但是这样工作量就会蛮大的了
希望有大佬可以帮我解决一下这个问题










