摘要
本说明书实施例公开了一种语音模型训练方法、装置、存储介质及电子设备,首先分别利用语音模型和文本模型对训练样本集中的训练样本进行特征提取,得到训练样本对应的样本音频特征和样本文本特征;然后根据训练样本集中训练样本的样本音频特征和样本音频的音频类别信息,生成分类损失值,分类损失值表征音频类别信息和实际类别信息之间的差异;然后根据训练样本集中训练样本的样本音频特征和样本文本特征,生成相似度损失值,相似度损失值表征样本音频特征和样本文本特征之间的相似度;最后根据分类损失值和相似度损失值,调整语音模型和文本模型的参数。
技术关键词
音频特征
样本
文本
语音模型训练方法
三元组
音频识别方法
分类网络
融合特征
模型训练装置
参数
电子设备
特征提取模块
计算机程序产品
处理器
存储器
标识
系统为您推荐了相关专利信息
电梯机械部件
长短期记忆网络
风险预警方法
电梯传感器
电梯轿厢
生成平台
生成对抗网络
计算机视觉算法
视频输出模块
版权
文本
歌词显示方法
人工智能AI模型
歌词文件
样式
卷积神经网络模型
判断方法
包装机
样本
神经网络算法模型
指标
机器学习模型
样本
异常数据点
计算机可读指令