摘要
本公开提供了一种语音处理模型的训练方法、语音处理方法、装置及设备,属于计算机技术领域。方法包括:对样本语音信号进行语音编码,得到所述样本语音信号的语义嵌入表示和声学嵌入表示;对所述样本语音信号的参考语音文本进行音素提取和音素编码,得到所述参考语音文本的音素嵌入表示;基于所述语义嵌入表示、所述声学嵌入表示以及所述音素嵌入表示,训练语音处理模型,所述语音处理模型用于对输入的语音进行实时语音合成。该方法通过在模型训练过程中引入了语义信息和声学信息,使得模型能够学习到更干净的语义信息,在对语音进行处理时,可以保留更多的语言信息,提高了合成语音的自然度。
技术关键词
语音编码
语音特征
语义
样本
文本
信号
实时语音
解码单元
电子设备
可执行程序代码
处理器
可读存储介质
计算机程序产品
序列
训练装置
存储器
系统为您推荐了相关专利信息
检测元件
字符识别模型
异常检测方法
图像
计算机视觉技术
电机运行故障
故障预测模型
长短期记忆网络
时间序列特征
频域特征