摘要
本申请公开了一种语音合成方法、模型训练方法及相关装置;其中所述方法包括:确定文本信息对应的隐变量;基于所述隐变量,确定所述文本信息对应的基频信息;基于所述隐变量和所述基频信息,生成所述文本信息对应的合成语音。这样,在文本生成语音的过程中,通过引入基频信息,可以从文本信息的音素级别控制基频走势,同时解决了解码器合成语音时的音高断裂问题,从而提高合成语音的音质。
技术关键词
文本
样本
变量
模型训练方法
编码器
解码器
噪声信息
计算机程序产品
模型训练装置
模块
可读存储介质
正弦波
生成语音
处理器
数据
计算机设备
上采样
存储器
系统为您推荐了相关专利信息
措施
控制优化方法
协同优化算法
模糊综合评价法
仿真模型
显示器校正方法
数据
亮度
背光检测模块
点亮显示屏