摘要
本申请公开了一种音素后验图模型训练方法、设备、介质及程序产品,涉及音频处理技术领域。该方法包括:通过利用主唱音频与和声音频在音素后验图特征上的差异,对音素后验图模型进行训练,并且和声音频为基于主唱音频生成的包含除主唱外其余人声的音频,由此经过训练得到的训练后音素后验图模型具备从和声音频中提取主唱音频的能力,利用该训练后音素后验图模型提取待转换歌声文件中的主唱歌声内容,能够提高主唱歌声内容提取的准确性,进而提高歌声转换的质量。
技术关键词
模型训练方法
转换方法
音频
解码器
融合特征
场景
人声
音色特征
存储计算机程序
计算机程序产品
处理器
可读存储介质
电子设备
存储器
数据