语音生成模型训练方法、装置、设备及介质

AITNT
正文
推荐专利
语音生成模型训练方法、装置、设备及介质
申请号:CN202510499283
申请日期:2025-04-18
公开号:CN120452416A
公开日期:2025-08-08
类型:发明专利
摘要
本发明涉及语音合成技术领域,提供了一种语音生成模型训练方法:获取样本数据集;通过预设训练模型中的语义特征模块对样本文本和样本语音进行语义特征识别,得到样本语义特征;通过声学特征模块对样本语音和样本语义特征进行声学特征识别,得到样本声学特征;通过声学解码模块对样本声学特征进行语音生成,得到预测生成语音;根据与同一样本文本对应的预测生成语音和样本语音,确定预测损失值;在预测损失值达到收敛条件时,将收敛之后的预设训练模型记录为语音生成模型。本发明应用于医疗问答场景或金融问答场景中。本发明通过语义特征模块和声学特征模块,实现了对语义特征和声学特征的条件分布的模拟,提高了训练时语音生成的效率。
技术关键词
语音生成模型 声学特征 语义特征 样本 生成语音 语音生成方法 问答场景 解码模块 编码特征 识别模块 文本编码器 可读存储介质 数据获取模块 处理器
系统为您推荐了相关专利信息
1
一种基于SOM和聚类算法的电力用户分类系统及方法
SOM算法 负荷 方差贡献率 曲线 协方差矩阵
2
一种基于残差网络的换流变分接开关故障检测方法及装置
分接开关故障 残差神经网络 有载分接开关 残差网络 换流变分接开关
3
一种HSD锂电池筛选模型构建方法、系统、设备及介质
锂电池筛选 模型构建方法 充放电数据 信息熵 动态
4
一种面向城乡居民的概率负荷预测方法及系统
历史负荷数据 负荷预测方法 负荷预测模型 负荷预测系统 样本
5
一种概率性框架下应用于光伏功率的层级式调和预测方法
节点 预报误差 矩阵 层级 表达式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号