摘要
本公开关于一种语音合成方法、装置、电子设备及存储介质,该方法包括:获取待合成文本和提示语音;基于所述待合成文本的音素序列和所述提示语音进行时长预测,得到目标合成语音的播放时长信息;基于所述播放时长信息调整所述音素序列的序列长度,得到目标音素序列;所述目标音素序列的序列长度与所述播放时长信息相匹配;对所述目标音素序列进行特征提取,基于所述特征提取的结果和先验分布生成目标语义特征;基于所述目标语义特征和所述先验分布生成目标声学特征,基于所述目标声学特征生成所述目标合成语音,本公开提高了语音合成速度,且合成语音的自然度高、字错误率低,大大提升了合成语音的质量。
技术关键词
声学特征
编码特征
语义特征
样本
文本
序列
语音特征
风格
电子设备
声纹特征
对象
融合特征
特征提取网络
处理器
可读存储介质
关系
计算机程序产品
系统为您推荐了相关专利信息
XGBoost模型
计算机装置
错误率
疾病预测技术
对象
多模态
电力系统智能
动态知识图谱
大语言模型
语音识别模型