音频识别模型的训练方法及装置、存储介质、电子设备

正文

推荐专利

申请号：CN202411945376

申请日期：2024-12-26

公开号：CN119832899A

公开日期：2025-04-15

类型：发明专利

摘要

本公开涉及人工智能技术领域，提供了一种音频识别模型的训练方法、音频识别模型的训练装置、计算机可读存储介质、电子设备，其中，方法包括：获取多组训练样本，并采集每组训练样本中包含的每个音频对应的每个频谱信息；通过特征提取网络提取每个频谱特征，通过音频编码器对每个频谱特征进行编码，获得每个音频向量；根据每组训练样本对应的音频向量之间的差异程度确定每组训练样本对应的对比损失值，并根据多组对比损失值对特征提取网络和音频编码器进行迭代训练；在对比损失值满足第一预设收敛条件时，冻结特征提取网络和音频编码器，根据多组训练样本对应的音频向量对分类器进行迭代训练，获得音频识别模型。本公开能够提升音频识别准确度。

技术关键词

音频编码器特征提取网络样本频谱特征分类器标签训练装置电子设备可读存储介质人工智能技术处理器编码模块资源库计算机滤波器指令信号

系统为您推荐了相关专利信息

一种考虑驾驶分心的严重冲突及碰撞预测方法、系统、设备及存储介质

碰撞预测方法非参数检验方法时域特征频域特征方向盘

一种基于YOLO11-WDSA模型的水下垃圾检测方法

垃圾检测方法上采样模块更新网络参数特征提取能力

一种基于TCN神经网络的PM2.5预测方法

神经网络预测模型变分模态分解算法搜索算法优化经验模态分解算法 K均值聚类算法

一种基于代表性样本选择与上下文增强的大模型命名实体识别方法及系统

命名实体识别方法样本大语言模型动态上下文文本

底盘控制方法、装置及电子设备

车辆行驶数据底盘控制方法大语言模型决策样本

音频识别模型的训练方法及装置、存储介质、电子设备

站点导航

APP 下载