音频识别模型的训练方法及装置、存储介质、电子设备

AITNT
正文
推荐专利
音频识别模型的训练方法及装置、存储介质、电子设备
申请号:CN202411945376
申请日期:2024-12-26
公开号:CN119832899A
公开日期:2025-04-15
类型:发明专利
摘要
本公开涉及人工智能技术领域,提供了一种音频识别模型的训练方法、音频识别模型的训练装置、计算机可读存储介质、电子设备,其中,方法包括:获取多组训练样本,并采集每组训练样本中包含的每个音频对应的每个频谱信息;通过特征提取网络提取每个频谱特征,通过音频编码器对每个频谱特征进行编码,获得每个音频向量;根据每组训练样本对应的音频向量之间的差异程度确定每组训练样本对应的对比损失值,并根据多组对比损失值对特征提取网络和音频编码器进行迭代训练;在对比损失值满足第一预设收敛条件时,冻结特征提取网络和音频编码器,根据多组训练样本对应的音频向量对分类器进行迭代训练,获得音频识别模型。本公开能够提升音频识别准确度。
技术关键词
音频编码器 特征提取网络 样本 频谱特征 分类器 标签 训练装置 电子设备 可读存储介质 人工智能技术 处理器 编码模块 资源库 计算机 滤波器 指令 信号
系统为您推荐了相关专利信息
1
一种考虑驾驶分心的严重冲突及碰撞预测方法、系统、设备及存储介质
碰撞预测方法 非参数检验方法 时域特征 频域特征 方向盘
2
一种基于YOLO11-WDSA模型的水下垃圾检测方法
垃圾检测方法 上采样 模块 更新网络参数 特征提取能力
3
一种基于TCN神经网络的PM2.5预测方法
神经网络预测模型 变分模态分解算法 搜索算法优化 经验模态分解算法 K均值聚类算法
4
一种基于代表性样本选择与上下文增强的大模型命名实体识别方法及系统
命名实体识别方法 样本 大语言模型 动态上下文 文本
5
底盘控制方法、装置及电子设备
车辆行驶数据 底盘控制方法 大语言模型 决策 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号