一种基于多尺度特征融合和改进FastViT模型的室内异常声识别方法

正文

推荐专利

申请号：CN202510271585

申请日期：2025-03-09

公开号：CN120236611A

公开日期：2025-07-01

类型：发明专利

摘要

本发明的目的是针对当前室内异常声识别算法中，无法有效捕捉室内环境中声音的多层次、时空变化特征，导致在时频复杂情况下表现不佳，限制了其准确性的问题。本发明提出了一种基于多尺度特征融合的室内异常声音识别方法。首先，从原始音频中提取Gammatone特征，模拟人耳听觉系统对声音的处理来建模声音的时频特征。而后，通过改进一个多尺度特征融合模块，捕捉输入特征中不同粒度级别的信息，并且通过不同的注意力对不同尺度上的特征进行聚合，从而得到特征的多样化表示，随后，将该模块嵌入到FastViT模型，使得模型能够更有效地关注异常声的关键部分，同时降低背景噪声的干扰，提高了室内异常声识别的准确性和鲁棒性。

技术关键词

多尺度特征融合异常声音识别方法背景噪声网络音频特征提取分支婴儿哭声模块数据声学特征注意力识别算法输出特征样本通道多层次

系统为您推荐了相关专利信息

基于神经网络代理模型的MPCVD腔体结构仿真优化方法

MPCVD设备仿真优化方法腔体结构神经网络训练集网格编码器

与车载设备进行无线通信的方法、装置及电子设备

通信设备车载设备密钥加密数据非对称加密算法

致密油藏破裂压力与产量分类的预判方法及装置

致密油藏压力灰色关联分析数据支持向量回归算法

基于混合专家的视觉语言模型的令牌路由增强方法

令牌视觉负载均衡策略序列图像

基于多尺度时序特征融合的预约服务退单预测方法及装置

时序特征预约平台 Attention机制多尺度订单

一种基于多尺度特征融合和改进FastViT模型的室内异常声识别方法

站点导航

APP 下载