一种语音模型训练方法、装置、存储介质及电子设备

正文

推荐专利

申请号：CN202410853569

申请日期：2024-06-27

公开号：CN118969016A

公开日期：2024-11-15

类型：发明专利

摘要

本说明书实施例公开了一种语音模型训练方法、装置、存储介质及电子设备，首先分别利用语音模型和文本模型对训练样本集中的训练样本进行特征提取，得到训练样本对应的样本音频特征和样本文本特征；然后根据训练样本集中训练样本的样本音频特征和样本音频的音频类别信息，生成分类损失值，分类损失值表征音频类别信息和实际类别信息之间的差异；然后根据训练样本集中训练样本的样本音频特征和样本文本特征，生成相似度损失值，相似度损失值表征样本音频特征和样本文本特征之间的相似度；最后根据分类损失值和相似度损失值，调整语音模型和文本模型的参数。

技术关键词

音频特征样本文本语音模型训练方法三元组音频识别方法分类网络融合特征模型训练装置参数电子设备特征提取模块计算机程序产品处理器存储器标识

系统为您推荐了相关专利信息

一种基于多模态数据的电梯安全风险预警方法

电梯机械部件长短期记忆网络风险预警方法电梯传感器电梯轿厢

一种基于AI的视频生成平台

生成平台生成对抗网络计算机视觉算法视频输出模块版权

歌词显示方法、设备、存储介质及程序产品

文本歌词显示方法人工智能AI模型歌词文件样式

基于神经网络算法的包装机空头检测点检行为判断方法

卷积神经网络模型判断方法包装机样本神经网络算法模型

一种业务流程的优化方法及相关装置

指标机器学习模型样本异常数据点计算机可读指令

一种语音模型训练方法、装置、存储介质及电子设备

站点导航

APP 下载