摘要
本申请提供了一种基于音标和语义的语音生成方法、基于音标和语义的语音生成模型训练方法、装置、电子设备及计算机可读存储介质。在本申请实施例中,通过将文本数据中的语义特征矩阵和具有音标数据特征的引导信息进行融合,得到具有语义信息和音标信息的融合特征矩阵,并通过融合特征矩阵输入至语音生成模型得到文本数据对应的语音数据,由于输入信息中融合了音标和语义的信息,音标所对应的语音根据不同的语义进行调整,使得语音不再平均化,减少机械感,本申请实施例的基于音标和语义的语音生成方法,充分利用输入文本中包含的信息,无需增加额外输入数据,即可生成更加逼真的语音数据,改善了语音生成的效果。
技术关键词
语音生成模型
语音生成方法
文本
数据
语义特征
样本
旁路
矩阵
融合特征
可读存储介质
电子设备
模块
语音编码
处理器
指令
存储器
程序
系统为您推荐了相关专利信息
测试数据处理方法
数据生成算法
访问控制列表配置方法
权限管理方法
备份
高精度定位系统
定位算法
5G通讯模块
高增益天线
传感器模块
粒子群算法
拓扑结构识别方法
编码向量
纠错机制
低压
多模态
实时数据
作业参数
输入输出单元
高精度时间戳
相似性检索方法
高斯混合模型
深度神经网络
检索系统
解码模块