基于异构关系图的端到端语音合成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510221509

申请日期：2025-02-26

公开号：CN120148469A

公开日期：2025-06-13

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了基于异构关系图的端到端语音合成方法、装置、设备及介质，方法包括：接收给定文本并提取所述给定文本中的语言学信息；对所述语言学信息进行编码得到对应的异构关系图；采用图卷积网络对所述异构关系图中的每个节点进行初始化、特征聚合和归一化处理，以获取每一节点的节点特征；将所述节点特征输入端到端的TTS模型，以生成相应的语音波形。本发明将确定性的语言学信息以异构关系图的形式输入至TTS模型，能够有效表征音素及句法信息。在此过程中，借助图卷积网络学习结构化表示，并将其应用于TTS模型的编码器。从而实现基于异构关系图的文本到语音合成方案，具有凭借句法优势实现显著性能提升的优点。

技术关键词

节点特征异构关系文本波形信息编码确定性规则网络句法信息可读存储介质邻居特征提取模块人工智能技术生成语音消除噪声处理器编码模块

系统为您推荐了相关专利信息

基于GPS评估数据学生专业定向方法及设备

专业学生定向方法兴趣模块

高效的覆盖路径规划算法

路径规划算法小面积广度优先搜索轨迹清扫地图

一种基于多层语义特征提取结构的问答文本匹配方法

智能信息处理终端文本匹配方法语义特征提取指令智能交互模块

一种基于四元数坐标变换的立体视觉无人机高精度定位方法

无人机高精度立体相机系统立体视觉坐标系定位方法

一种基于自然语言处理的医疗设备信息整合方法及系统

医疗设备信息语义理解模型关系型数据库构建文件系统构建查询语句

基于异构关系图的端到端语音合成方法、装置、设备及介质

站点导航

APP 下载