摘要
本公开提供了一种语音处理模型的训练方法、语音处理方法、装置及设备,属于计算机技术领域。该方法通过在模型训练过程中通过语音处理模型对样本语音信号和参考语音文本进行处理,来得到语义嵌入表示、副语言嵌入表示以及音素嵌入表示,实现了将声学编码、语义编码、副语言编码完全解耦,消除了语义编码过程中的副语言残留,提高了模型的训练效率,再通过对比损失以及声学重构损失来进行模型训练,增强了语义编码的完整性与重构保真度,提高了训练得到的语音处理模型的语音处理效果。
技术关键词
语义
语音特征
样本
信号
编码器
重构
文本
语音编码
计算机程序产品
电子设备
可执行程序代码
编解码
处理器
可读存储介质
解码单元
训练装置
滑动窗口