sovits训练的一大工作量便是训练前期寻找并制作切片合适且高质量的数据集。对于番剧和漫画角色若是从动画原作中提取通常费时费力并且可能有杂音。稿主在此分享一个便捷的搜集途径,即通过战舰世界的语音mod制作数据集。目前战舰世界的联动项目有钢铁苍蓝的琵音,高校舰队,Hololive vtuber,以及大家非常熟知的碧蓝航线。对于此种方法有以下几大优势: 1.训练干音清晰,高质量。战舰世界的语音在经过提取以后的清晰度可以划分为最高的一档,完全不存在有杂音干扰训练一说。 2.无需切片,提取和使用方便。由于语音多为战斗指令播报,因此长度均为3-5s以内,不需要额外进行切片可以直接放入数据处理。对于提取,需要做的仅仅是将wem文件转换为普通的音频文件,再利用UVR过一遍(洗去部分语音开头的无线电播报音和场景音效)即可获得高质量数据。 3.训练集小,训练快,质量高。联动语音条数多为100-200条内,可能有的观众会认为这么短的训练集无法训练。在这里稿主可以很负责任的告诉大家,利用语音mod训练出来的效果非常好,而且需要的步数非常少,万步左右已经非常接近,3w-5w步左右便可以拿来使用。具体效果可以参考稿主本条作品 [color=var(--theme-color)]【战舰世界】【AI 伊欧娜】world.execute(me);_哔哩哔哩_bilibili 语音素材191条,最终采用56000步模型。视频内混有原战斗指令,可以直观对比效果 对于疑问:或许很多人会认为这就是个普通的利用游戏解包获取资源进行炼丹的操作为什么要单独拉出来说明。这里要注意的是,战舰世界语音多数为联动作品,也就是说你可以通过解包获得用于训练部分番剧和动漫角色的素材,而不用去原作当中提取。如果你想训练以上几部作品中的角色,不妨可以去了解一下是否有过联动舰长,可以事半功倍。 目前网站还不允许上传除了图片以外的文件,因此稿主无法上传已处理过的训练原始数据和用于提取wem至ogg的脚本。如有需要可以评论私信,或者去b站联系我,b站名 伊欧娜的舰长CaptainOri
|