摘要
本申请涉及一种声学处理模型的训练方法、语音处理方法及相关产品。方法包括:基于样本对象在不同预设时间段内的语音,确定样本对象的第一频谱;通过声学处理模型对样本对象在当前时间段内的样本音素与第一频谱进行融合处理,得到融合特征信息;以及,对融合特征信息进行声学处理获得第二频谱,并基于第二频谱与样本音素的标签频谱的差异,对声学处理模型进行训练。采用本方法能够使得合成的语音音色稳定、更加真实。
技术关键词
频谱特征
融合特征
语音特征信息
时间段
样本
语音生成模型
对象
文本
注意力
声学特征
计算机程序产品
处理器
训练装置
标签
计算机设备
编码
模块
可读存储介质
存储器
系统为您推荐了相关专利信息
可变车道数量
协同控制方法
道路环境条件
路段
序列
鱼眼图像
层级
畸变矫正方法
输出特征
前馈神经网络