一种音频识别方法及装置

正文

推荐专利

一种音频识别方法及装置

申请号：CN202510972010

申请日期：2025-07-14

公开号：CN120656482A

公开日期：2025-09-16

类型：发明专利

摘要

本申请公开了一种音频识别方法及装置，属于音频识别技术领域，所述方法包括：对音频数据进行形式转换处理，得到所述音频数据对应的张量形式的张量特征数据；通过音频识别模型对所述张量特征数据进行特征转化处理和循环特征提取处理，得到所述张量特征数据对应的高维音频特征数据，并通过所述音频识别模型对所述高维音频特征数据进行分类处理，识别出所述音频数据中是否存在异常声音以及在存在所述异常声音的情况下输出所述异常声音所属的类别。本申请的音频识别模型通过轻量化设计，可以节省大量硬件资源，能够在计算资源和存储空间有限的边缘设备上部署和高效运行，实现快速准确的异常音频识别。

技术关键词

音频特征数据异常声音音频识别方法多分支声音类别融合特征多阶段音频识别技术音频识别装置训练装置样本注意力特征提取单元模型训练模块可读存储介质

系统为您推荐了相关专利信息

一种基于点云视频的语义特征优化与QoE评估方法

重建点云视频语义特征提取多分支结构矩阵

入侵检测网络模型的训练方法及装置、设备、存储介质

检测网络模型频域特征网络流量数据多分支融合特征

一种基于多支路卷积注意力模型的光学影像图像分割方法

卷积注意力网络注意力模型图像分割方法支路掩码矩阵

基于RepViT和十字卷积的SAR图像舰船检测方法

图像舰船检测方法输出特征上采样切片特征融合网络

基于改进的LSTM增强心电图（ECG）分类方法

心电信号识别分类连续小波变换多分支生物医学信号处理卷积神经网络模块

一种音频识别方法及装置

站点导航

APP 下载