摘要
本申请公开了一种音频识别方法及装置,属于音频识别技术领域,所述方法包括:对音频数据进行形式转换处理,得到所述音频数据对应的张量形式的张量特征数据;通过音频识别模型对所述张量特征数据进行特征转化处理和循环特征提取处理,得到所述张量特征数据对应的高维音频特征数据,并通过所述音频识别模型对所述高维音频特征数据进行分类处理,识别出所述音频数据中是否存在异常声音以及在存在所述异常声音的情况下输出所述异常声音所属的类别。本申请的音频识别模型通过轻量化设计,可以节省大量硬件资源,能够在计算资源和存储空间有限的边缘设备上部署和高效运行,实现快速准确的异常音频识别。
技术关键词
音频特征数据
异常声音
音频识别方法
多分支
声音类别
融合特征
多阶段
音频识别技术
音频识别装置
训练装置
样本
注意力
特征提取单元
模型训练模块
可读存储介质
系统为您推荐了相关专利信息
检测网络模型
频域特征
网络流量数据
多分支
融合特征
卷积注意力网络
注意力模型
图像分割方法
支路
掩码矩阵
图像舰船检测方法
输出特征
上采样
切片
特征融合网络
心电信号识别分类
连续小波变换
多分支
生物医学信号处理
卷积神经网络模块