摘要
本发明涉及人工智能技术领域,公开了基于异构关系图的端到端语音合成方法、装置、设备及介质,方法包括:接收给定文本并提取所述给定文本中的语言学信息;对所述语言学信息进行编码得到对应的异构关系图;采用图卷积网络对所述异构关系图中的每个节点进行初始化、特征聚合和归一化处理,以获取每一节点的节点特征;将所述节点特征输入端到端的TTS模型,以生成相应的语音波形。本发明将确定性的语言学信息以异构关系图的形式输入至TTS模型,能够有效表征音素及句法信息。在此过程中,借助图卷积网络学习结构化表示,并将其应用于TTS模型的编码器。从而实现基于异构关系图的文本到语音合成方案,具有凭借句法优势实现显著性能提升的优点。
技术关键词
节点特征
异构
关系
文本
波形
信息编码
确定性规则
网络
句法信息
可读存储介质
邻居
特征提取模块
人工智能技术
生成语音
消除噪声
处理器
编码模块
系统为您推荐了相关专利信息
路径规划算法
小面积
广度优先搜索
轨迹
清扫地图
智能信息处理终端
文本匹配方法
语义特征提取
指令
智能交互模块
无人机高精度
立体相机系统
立体视觉
坐标系
定位方法
医疗设备信息
语义理解模型
关系型数据库
构建文件系统
构建查询语句