摘要
本说明书实施例公开了一种训练文本转语音模型、文本转语音的方法、装置及设备。重新定义了文本转语音模型的输入数据的构成,输入数据不仅包括已插入韵律符号的文本对应的音素序列,也包括能够表示文本在至少一个粒度层级上的结构划分的结构标注信息,从而使得文本转语音模型在进行语音特征预测的过程中,不仅可以参考文本在音素层面的韵律,而且还可以参考文本在单字词、短语、语句等粒度层面上的韵律,这样可以使得预测出的语音特征所得到的语音韵律具有文本结构上发音的连贯性,韵律更加自然。需要说明,本公开属于人工智能领域的技术方案,在方案实现时,所使用的隐私数据已经得到所有方授权。
技术关键词
文本
层级
韵律模型
符号
序列
语音特征
样本
算法框架
编码特征
模块
回归算法
计算机程序产品
处理器
发音
语句
元素
存储器
编码器
电子设备
系统为您推荐了相关专利信息
对照功能
树形结构数据
测试方法
目录
计算机程序指令
新安江模型
径流预测方法
历史降雨量
注意力
汇流
导线舞动监测方法
加速度
舞动监测系统
输出警示信息
主控模块
超声图像优化方法
信号
生成超声图像
分布式图像处理
噪声数据