摘要
本公开涉及人工智能技术领域,提供了一种音频识别模型的训练方法、音频识别模型的训练装置、计算机可读存储介质、电子设备,其中,方法包括:获取多组训练样本,并采集每组训练样本中包含的每个音频对应的每个频谱信息;通过特征提取网络提取每个频谱特征,通过音频编码器对每个频谱特征进行编码,获得每个音频向量;根据每组训练样本对应的音频向量之间的差异程度确定每组训练样本对应的对比损失值,并根据多组对比损失值对特征提取网络和音频编码器进行迭代训练;在对比损失值满足第一预设收敛条件时,冻结特征提取网络和音频编码器,根据多组训练样本对应的音频向量对分类器进行迭代训练,获得音频识别模型。本公开能够提升音频识别准确度。
技术关键词
音频编码器
特征提取网络
样本
频谱特征
分类器
标签
训练装置
电子设备
可读存储介质
人工智能技术
处理器
编码模块
资源库
计算机
滤波器
指令
信号
系统为您推荐了相关专利信息
碰撞预测方法
非参数检验方法
时域特征
频域特征
方向盘
垃圾检测方法
上采样
模块
更新网络参数
特征提取能力
神经网络预测模型
变分模态分解算法
搜索算法优化
经验模态分解算法
K均值聚类算法
命名实体识别方法
样本
大语言模型
动态上下文
文本
车辆行驶数据
底盘控制方法
大语言模型
决策
样本