基于句法图构建的文本到语音生成方法、装置及电子设备

正文

推荐专利

申请号：CN202411059713

申请日期：2024-08-05

公开号：CN118588056B

公开日期：2025-03-14

类型：发明专利

摘要

本申请涉及计算机技术领域，公开了一种基于句法图构建的文本到语音生成方法、装置及电子设备，该方法包括获取待处理文本和目标参考语音；根据待处理文本，确定待处理文本对应的文本信息和音素信息；基于文本信息和目标语音生成模型中的目标句法图构建网络，生成待处理文本对应的目标句法图；基于音素信息、边界信息、目标句法图，以及目标语音生成模型中的目标编码网络，生成待处理文本对应的目标字级编码；基于目标字级编码、目标参考语音，以及目标语音生成模型中的目标语音生成网络，生成目标合成语音。本申请实施例提供的文本到语音的方法所生成的目标合成语音具有待处理文本的韵律特征，提高了合成语音的真实性和丰富性。

技术关键词

语音生成模型文本语音生成方法编码节点网络韵律特征字符样本关系风格电子设备处理器生成装置数据解析器模块可读存储介质程序

系统为您推荐了相关专利信息

一种FMI图像裂缝分割方法及装置

图像裂缝分割方法编码模块解码模块可变形卷积层数据

一种基于分层语义表示和聚合网络的视频字幕生成方法

视频字幕生成方法融合语义动作特征分层生成字幕

一种基于北斗动态优先级调度的图像传输方法和系统

图像传输方法符号冗余编码方法终端获取图像队列

一种基于混合特征的代码漏洞检测及行风险排序方法

排序方法集成梯度语句标记漏洞

一种基于非监督学习的空气质量推断方法

拥堵指数编码模块非监督网格推断方法

基于句法图构建的文本到语音生成方法、装置及电子设备

站点导航

APP 下载