摘要
本申请提供了一种基于音标和语义的语音生成方法、基于音标和语义的语音生成模型训练方法、装置、电子设备及计算机可读存储介质。在本申请实施例中,通过将文本数据中的语义特征矩阵和具有音标数据特征的引导信息进行融合,得到具有语义信息和音标信息的融合特征矩阵,并通过融合特征矩阵输入至语音生成模型得到文本数据对应的语音数据,由于输入信息中融合了音标和语义的信息,音标所对应的语音根据不同的语义进行调整,使得语音不再平均化,减少机械感,本申请实施例的基于音标和语义的语音生成方法,充分利用输入文本中包含的信息,无需增加额外输入数据,即可生成更加逼真的语音数据,改善了语音生成的效果。
技术关键词
语音生成模型
语音生成方法
文本
数据
语义特征
样本
旁路
矩阵
融合特征
可读存储介质
电子设备
模块
语音编码
处理器
指令
存储器
程序
系统为您推荐了相关专利信息
液压支架
基准轮廓
采煤设备
多模态数据采集
控制系统
轮廓重构方法
倾斜摄影模型
轮廓边
节点
计算机程序产品
配电网故障定位
数据采集模块
识别方法
数学模型
配电线路故障检测
天然气场站
监控预警系统
视频监控预警方法
智能分析算法
环境感知数据
混合神经网络模型
乙烯精馏塔
鲸鱼优化算法
编码器
超参数