摘要
本发明的目的是针对当前室内异常声识别算法中,无法有效捕捉室内环境中声音的多层次、时空变化特征,导致在时频复杂情况下表现不佳,限制了其准确性的问题。本发明提出了一种基于多尺度特征融合的室内异常声音识别方法。首先,从原始音频中提取Gammatone特征,模拟人耳听觉系统对声音的处理来建模声音的时频特征。而后,通过改进一个多尺度特征融合模块,捕捉输入特征中不同粒度级别的信息,并且通过不同的注意力对不同尺度上的特征进行聚合,从而得到特征的多样化表示,随后,将该模块嵌入到FastViT模型,使得模型能够更有效地关注异常声的关键部分,同时降低背景噪声的干扰,提高了室内异常声识别的准确性和鲁棒性。
技术关键词
多尺度特征融合
异常声音
识别方法
背景噪声
网络
音频特征提取
分支
婴儿哭声
模块
数据
声学特征
注意力
识别算法
输出特征
样本
通道
多层次
系统为您推荐了相关专利信息
MPCVD设备
仿真优化方法
腔体结构
神经网络训练集
网格编码器
通信设备
车载设备
密钥
加密数据
非对称加密算法
致密油藏
压力
灰色关联分析
数据
支持向量回归算法
时序特征
预约平台
Attention机制
多尺度
订单