摘要
本申请涉及一种基于韵律边界信息和VAE结构的语音合成模型生成方法。所述方法包括:获取训练数据集;训练数据集包括样本语音以及样本语音对应的韵律边界信息、文本信息和音素信息;根据样本语音以及对应的音素信息,训练语音合成网络,得到训练后的语音合成网络;根据样本语音以及对应的韵律边界信息,训练韵律编码网络,得到训练后的韵律编码网络;根据样本语音以及对应的文本信息、音素信息和韵律边界信息,训练韵律预测网络,得到训练后的韵律预测网络;根据训练后的语音合成网络、训练后的韵律编码网络和训练后的韵律预测网络,生成基于韵律边界信息和VAE结构的语音合成模型。采用本方法能够生成具有准确韵律的合成语音,提高合成语音的准确率。
技术关键词
韵律预测
编码器
网络
韵律特征
样本
生成语音
模型生成方法
文本
序列
语音生成方法
模型生成装置
数据获取模块
计算机程序产品
字符
处理器
机制
计算机设备
系统为您推荐了相关专利信息
成像重建方法
注意力
图像重建
模拟成像系统
快照
阀侧套管
测温
表带触指
支持向量回归机
套管外表面