摘要
本申请公开了一种语音合成方法及相关装置、设备和存储介质,其中,语音合成方法包括:基于特征预测模型预测待合成字符序列的发音特征;其中,待合成字符序列为文本序列或音素序列,发音特征至少包含待合成字符序列与发音内容和发音韵律相关的特征信息;基于声学模型对发音特征和待合成字符序列的序列隐层特征进行预测,得到声学特征;其中,序列隐层特征为特征预测模型处理待合成字符序列过程中所得到的隐层特征;基于声码器对声学特征进行波形恢复,得到合成语音。上述方案,能够提升语音合成的稳定性和自然度。
技术关键词
发音特征
声学特征
序列
字符
特征提取模型
生成对抗网络
语音编码
矢量量化
文本
声码器
度量
参数
波形
模块
样本
程序
处理器
系统为您推荐了相关专利信息
医学图像分割方法
注意力
语义特征
对齐模块
转换器
负荷识别方法
组合电器
特征谱图
矩阵
注意力机制
精确估计方法
多普勒
品质因数
因子
双曲调频信号