摘要
本公开涉及计算机技术领域,涉及一种音频数据集构建方法及装置、音频识别模型的训练方法及装置、计算机程序产品和电子设备。该音频数据集构建方法包括:将原始音频进行伴唱分离,得到干声音频和初始伴奏音频;对干声音频中的干声片段进行编辑处理,得到干声增强音频;根据干声增强音频和参考伴奏音频生成原始音频的增强音频数据,以根据多个增强音频数据构建翻唱音频数据集;其中,参考伴奏音频的来源音频与原始音频之间不存在翻唱关系。本公开能提高构建翻唱音频数据集的准确性,从而提升音频识别模型的训练精度。
技术关键词
音频
数据集构建方法
样本
编辑
模型训练模块
关系
计算机程序产品
训练装置
电子设备
速度
精度