音频数据集构建方法、音频识别模型的训练方法、装置

正文

推荐专利

申请号：CN202510205951

申请日期：2025-02-24

公开号：CN120048252A

公开日期：2025-05-27

类型：发明专利

摘要

本公开涉及计算机技术领域，涉及一种音频数据集构建方法及装置、音频识别模型的训练方法及装置、计算机程序产品和电子设备。该音频数据集构建方法包括：将原始音频进行伴唱分离，得到干声音频和初始伴奏音频；对干声音频中的干声片段进行编辑处理，得到干声增强音频；根据干声增强音频和参考伴奏音频生成原始音频的增强音频数据，以根据多个增强音频数据构建翻唱音频数据集；其中，参考伴奏音频的来源音频与原始音频之间不存在翻唱关系。本公开能提高构建翻唱音频数据集的准确性，从而提升音频识别模型的训练精度。

技术关键词

音频数据集构建方法样本编辑模型训练模块关系计算机程序产品训练装置电子设备速度精度

音频数据集构建方法、音频识别模型的训练方法、装置

站点导航

APP 下载