摘要
本申请公开一种包括人声编码器、内容编码器和波形生成器的语音转换模型的训练方法,包括预训练内容编码器;预训练人声编码器;以及对抗训练语音转换模型的波形生成器和对应的判别器,对抗训练包括迭代执行下述步骤,直至达到预设的迭代终止条件:将训练音频分别输入内容编码器和人声编码器以输出内容特征和人声特征;将内容特征和人声特征输入波形生成器,生成训练生成音频,由判别器在训练音频和训练生成音频中判别真实音频和/或生成音频;由第一损失值更新波形生成器的参数;由第二损失值更新判别器的参数。本申请方案将通常应用于声码器的对抗训练用于训练声学模型,而省掉了声码器,提升了语音转换的生成效率,减低了训练成本。
技术关键词
人声
编码器
波形
音素后验概率
语音转换方法
音频特征
模型训练方法
激励残差网络
训练声学模型
注意力
参数
音色特征
序列
电子设备
解码器
处理器
存储器
系统为您推荐了相关专利信息
分集方法
Turbo解码器
Turbo编码器
多节点
矩阵
水下无线光通信
监督深度学习
编解码方法
解码模型
发射单元
数据类别识别方法
语义特征
标签
邻居
自然语言分析