基于音标和语义的语音生成方法及语音生成模型训练方法

AITNT
正文
推荐专利
基于音标和语义的语音生成方法及语音生成模型训练方法
申请号:CN202411973758
申请日期:2024-12-30
公开号:CN119993118A
公开日期:2025-05-13
类型:发明专利
摘要
本申请提供了一种基于音标和语义的语音生成方法、基于音标和语义的语音生成模型训练方法、装置、电子设备及计算机可读存储介质。在本申请实施例中,通过将文本数据中的语义特征矩阵和具有音标数据特征的引导信息进行融合,得到具有语义信息和音标信息的融合特征矩阵,并通过融合特征矩阵输入至语音生成模型得到文本数据对应的语音数据,由于输入信息中融合了音标和语义的信息,音标所对应的语音根据不同的语义进行调整,使得语音不再平均化,减少机械感,本申请实施例的基于音标和语义的语音生成方法,充分利用输入文本中包含的信息,无需增加额外输入数据,即可生成更加逼真的语音数据,改善了语音生成的效果。
技术关键词
语音生成模型 语音生成方法 文本 数据 语义特征 样本 旁路 矩阵 融合特征 可读存储介质 电子设备 模块 语音编码 处理器 指令 存储器 程序
系统为您推荐了相关专利信息
1
一种测试数据处理方法、电子设备、存储介质及程序
测试数据处理方法 数据生成算法 访问控制列表配置方法 权限管理方法 备份
2
一种基于5G网络的通讯模块用高精度定位系统
高精度定位系统 定位算法 5G通讯模块 高增益天线 传感器模块
3
基于粒子群算法的低压台区拓扑结构识别方法及相关装置
粒子群算法 拓扑结构识别方法 编码向量 纠错机制 低压
4
一种实时检测井壁的方法、系统、电子设备及存储介质
多模态 实时数据 作业参数 输入输出单元 高精度时间戳
5
基于VQ-VAE的频高图相似性检索系统与方法
相似性检索方法 高斯混合模型 深度神经网络 检索系统 解码模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号