摘要
本申请涉及计算机技术领域,公开了一种基于句法图构建的文本到语音生成方法、装置及电子设备,该方法包括获取待处理文本和目标参考语音;根据待处理文本,确定待处理文本对应的文本信息和音素信息;基于文本信息和目标语音生成模型中的目标句法图构建网络,生成待处理文本对应的目标句法图;基于音素信息、边界信息、目标句法图,以及目标语音生成模型中的目标编码网络,生成待处理文本对应的目标字级编码;基于目标字级编码、目标参考语音,以及目标语音生成模型中的目标语音生成网络,生成目标合成语音。本申请实施例提供的文本到语音的方法所生成的目标合成语音具有待处理文本的韵律特征,提高了合成语音的真实性和丰富性。
技术关键词
语音生成模型
文本
语音生成方法
编码
节点
网络
韵律特征
字符
样本
关系
风格
电子设备
处理器
生成装置
数据
解析器
模块
可读存储介质
程序
系统为您推荐了相关专利信息
图像裂缝分割方法
编码模块
解码模块
可变形卷积层
数据
视频字幕生成方法
融合语义
动作特征
分层
生成字幕
图像传输方法
符号
冗余编码方法
终端获取图像
队列