基于音标和语义的语音生成方法及语音生成模型训练方法

正文

推荐专利

申请号：CN202411973758

申请日期：2024-12-30

公开号：CN119993118A

公开日期：2025-05-13

类型：发明专利

摘要

本申请提供了一种基于音标和语义的语音生成方法、基于音标和语义的语音生成模型训练方法、装置、电子设备及计算机可读存储介质。在本申请实施例中，通过将文本数据中的语义特征矩阵和具有音标数据特征的引导信息进行融合，得到具有语义信息和音标信息的融合特征矩阵，并通过融合特征矩阵输入至语音生成模型得到文本数据对应的语音数据，由于输入信息中融合了音标和语义的信息，音标所对应的语音根据不同的语义进行调整，使得语音不再平均化，减少机械感，本申请实施例的基于音标和语义的语音生成方法，充分利用输入文本中包含的信息，无需增加额外输入数据，即可生成更加逼真的语音数据，改善了语音生成的效果。

技术关键词

语音生成模型语音生成方法文本数据语义特征样本旁路矩阵融合特征可读存储介质电子设备模块语音编码处理器指令存储器程序

系统为您推荐了相关专利信息

一种工作面实时轮廓的控制系统及控制方法

液压支架基准轮廓采煤设备多模态数据采集控制系统

规则要素的几何轮廓重构方法及计算机程序产品

轮廓重构方法倾斜摄影模型轮廓边节点计算机程序产品

一种中压配电网故障定位识别方法及系统

配电网故障定位数据采集模块识别方法数学模型配电线路故障检测

一种无人化天然气场站视频监控预警系统及监控预警方法

天然气场站监控预警系统视频监控预警方法智能分析算法环境感知数据

一种乙烯浓度的预测方法、系统及存储介质

混合神经网络模型乙烯精馏塔鲸鱼优化算法编码器超参数

基于音标和语义的语音生成方法及语音生成模型训练方法

站点导航

APP 下载