摘要
本发明涉及一种语音合成方法、装置、存储介质及电子设备。获取待处理文本数据;将待处理文本数据输入预训练的低频带声学模型,得到低频频谱;将低频频谱输入预训练的高频解码器,得到合成语音;其中,低频带声学模型的预训练过程利用待处理文本数据与预先获取的低频语音数据完成,高频解码器的预训练过程利用待处理文本数据、预先获取的高频语音数据与预训练的低频带声学模型完成,低频语音数据通过第一预设采样率确定,高频语音数据通过第二预设采样率确定,第一预设采样率小于第二预设采样率。与现有技术相比,本发明具有能够利用少量的高采样率数据进行语音合成,并且保证语音合成的质量等优点。
技术关键词
语音
解码器
采样率
语义特征
文本编码器
注意力
电子设备
数据获取模块
存储器
计算机
处理器
关系
程序
系统为您推荐了相关专利信息
描述符
关键词
语义特征
智能化数据分析
规划系统
测绘设备
三维地理场景
异构地理信息
地理国情普查
遥感影像数据
施工作业现场
监测方法
特征提取模型
极限学习机算法
生成对抗网络