摘要
本申请提供了一种语音合成方法、装置、电子设备及存储介质,该方法包括:将各语音提供者提供的语音样本数据对应的语音特征数据输入到特征提取模型中,得到各语音提供者对应的语音提供者特征数据;将各语音提供者对应的语音提供者特征数据、文本数据作为样本数据,各语音提供者提供的语音样本数据作为标签,对各语音提供者对应的语音合成模型进行训练;根据训练完成的各语音提供者对应的语音合成模型进行语音合成。本申请通过各语音提供者对应的语音提供者特征数据对语音合成模型进行训练,以通过训练完成的语音合成模型合成自然而流畅的语音,无需提前建立语音库,避免出现无法将文本转化为语音的情况。
技术关键词
语音特征数据
编码特征
样本
MFCC特征
特征提取模型
适配器
文本
解码单元
年龄
机器可读指令
梅尔频率倒谱系数
参数
电子设备
标签
处理器
可读存储介质
系统为您推荐了相关专利信息
数据管理系统
多义词
同义词
数据管理模块
数据管理库
混合深度学习模型
抗菌肽
节点特征
序列
网络单元
医学图像数据
医学图像模态
转换方法
编码器
标志