摘要
本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质,属于人工智能及金融技术领域。该方法包括:获取样本语音数据、样本文本数据、第一样本合成语音数据和样本合成频谱数据;基于样本语音数据、样本文本数据、第一样本合成语音数据和样本合成频谱数据对原始频谱合成模型进行模型优化,得到目标频谱合成模型;根据样本合成频谱数据、第一样本合成语音数据对原始语音合成模型进行模型优化,得到目标语音合成模型;通过目标频谱合成模型对参考语音数据和目标文本数据进行频谱合成,得到目标频谱数据;通过目标语音合成模型对目标频谱数据进行语音合成,得到目标合成语音数据。本申请实施例能够提高合成语音的效率。
技术关键词
特征提取模型
样本
语音
文本
声码器
数据获取模块
电子设备
人声
可读存储介质
对象
参数
处理器
存储器
计算机
编码
金融