音频数据集构建方法、音频识别模型的训练方法、装置

AITNT
正文
推荐专利
音频数据集构建方法、音频识别模型的训练方法、装置
申请号:CN202510205951
申请日期:2025-02-24
公开号:CN120048252A
公开日期:2025-05-27
类型:发明专利
摘要
本公开涉及计算机技术领域,涉及一种音频数据集构建方法及装置、音频识别模型的训练方法及装置、计算机程序产品和电子设备。该音频数据集构建方法包括:将原始音频进行伴唱分离,得到干声音频和初始伴奏音频;对干声音频中的干声片段进行编辑处理,得到干声增强音频;根据干声增强音频和参考伴奏音频生成原始音频的增强音频数据,以根据多个增强音频数据构建翻唱音频数据集;其中,参考伴奏音频的来源音频与原始音频之间不存在翻唱关系。本公开能提高构建翻唱音频数据集的准确性,从而提升音频识别模型的训练精度。
技术关键词
音频 数据集构建方法 样本 编辑 模型训练模块 关系 计算机程序产品 训练装置 电子设备 速度 精度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号