基于音标和语义的语音生成方法及语音生成模型训练方法

AITNT
正文
推荐专利
基于音标和语义的语音生成方法及语音生成模型训练方法
申请号:CN202411973758
申请日期:2024-12-30
公开号:CN119993118A
公开日期:2025-05-13
类型:发明专利
摘要
本申请提供了一种基于音标和语义的语音生成方法、基于音标和语义的语音生成模型训练方法、装置、电子设备及计算机可读存储介质。在本申请实施例中,通过将文本数据中的语义特征矩阵和具有音标数据特征的引导信息进行融合,得到具有语义信息和音标信息的融合特征矩阵,并通过融合特征矩阵输入至语音生成模型得到文本数据对应的语音数据,由于输入信息中融合了音标和语义的信息,音标所对应的语音根据不同的语义进行调整,使得语音不再平均化,减少机械感,本申请实施例的基于音标和语义的语音生成方法,充分利用输入文本中包含的信息,无需增加额外输入数据,即可生成更加逼真的语音数据,改善了语音生成的效果。
技术关键词
语音生成模型 语音生成方法 文本 数据 语义特征 样本 旁路 矩阵 融合特征 可读存储介质 电子设备 模块 语音编码 处理器 指令 存储器 程序
系统为您推荐了相关专利信息
1
一种工作面实时轮廓的控制系统及控制方法
液压支架 基准轮廓 采煤设备 多模态数据采集 控制系统
2
规则要素的几何轮廓重构方法及计算机程序产品
轮廓重构方法 倾斜摄影模型 轮廓边 节点 计算机程序产品
3
一种中压配电网故障定位识别方法及系统
配电网故障定位 数据采集模块 识别方法 数学模型 配电线路故障检测
4
一种无人化天然气场站视频监控预警系统及监控预警方法
天然气场站 监控预警系统 视频监控预警方法 智能分析算法 环境感知数据
5
一种乙烯浓度的预测方法、系统及存储介质
混合神经网络模型 乙烯精馏塔 鲸鱼优化算法 编码器 超参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号