基于句法图构建的文本到语音生成方法、装置及电子设备

AITNT
正文
推荐专利
基于句法图构建的文本到语音生成方法、装置及电子设备
申请号:CN202411059713
申请日期:2024-08-05
公开号:CN118588056B
公开日期:2025-03-14
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种基于句法图构建的文本到语音生成方法、装置及电子设备,该方法包括获取待处理文本和目标参考语音;根据待处理文本,确定待处理文本对应的文本信息和音素信息;基于文本信息和目标语音生成模型中的目标句法图构建网络,生成待处理文本对应的目标句法图;基于音素信息、边界信息、目标句法图,以及目标语音生成模型中的目标编码网络,生成待处理文本对应的目标字级编码;基于目标字级编码、目标参考语音,以及目标语音生成模型中的目标语音生成网络,生成目标合成语音。本申请实施例提供的文本到语音的方法所生成的目标合成语音具有待处理文本的韵律特征,提高了合成语音的真实性和丰富性。
技术关键词
语音生成模型 文本 语音生成方法 编码 节点 网络 韵律特征 字符 样本 关系 风格 电子设备 处理器 生成装置 数据 解析器 模块 可读存储介质 程序
系统为您推荐了相关专利信息
1
一种FMI图像裂缝分割方法及装置
图像裂缝分割方法 编码模块 解码模块 可变形卷积层 数据
2
一种基于分层语义表示和聚合网络的视频字幕生成方法
视频字幕生成方法 融合语义 动作特征 分层 生成字幕
3
一种基于北斗动态优先级调度的图像传输方法和系统
图像传输方法 符号 冗余编码方法 终端获取图像 队列
4
一种基于混合特征的代码漏洞检测及行风险排序方法
排序方法 集成梯度 语句 标记 漏洞
5
一种基于非监督学习的空气质量推断方法
拥堵指数 编码模块 非监督 网格 推断方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号