一种基于多尺度特征融合和改进FastViT模型的室内异常声识别方法

AITNT
正文
推荐专利
一种基于多尺度特征融合和改进FastViT模型的室内异常声识别方法
申请号:CN202510271585
申请日期:2025-03-09
公开号:CN120236611A
公开日期:2025-07-01
类型:发明专利
摘要
本发明的目的是针对当前室内异常声识别算法中,无法有效捕捉室内环境中声音的多层次、时空变化特征,导致在时频复杂情况下表现不佳,限制了其准确性的问题。本发明提出了一种基于多尺度特征融合的室内异常声音识别方法。首先,从原始音频中提取Gammatone特征,模拟人耳听觉系统对声音的处理来建模声音的时频特征。而后,通过改进一个多尺度特征融合模块,捕捉输入特征中不同粒度级别的信息,并且通过不同的注意力对不同尺度上的特征进行聚合,从而得到特征的多样化表示,随后,将该模块嵌入到FastViT模型,使得模型能够更有效地关注异常声的关键部分,同时降低背景噪声的干扰,提高了室内异常声识别的准确性和鲁棒性。
技术关键词
多尺度特征融合 异常声音 识别方法 背景噪声 网络 音频特征提取 分支 婴儿哭声 模块 数据 声学特征 注意力 识别算法 输出特征 样本 通道 多层次
系统为您推荐了相关专利信息
1
基于神经网络代理模型的MPCVD腔体结构仿真优化方法
MPCVD设备 仿真优化方法 腔体结构 神经网络训练集 网格编码器
2
与车载设备进行无线通信的方法、装置及电子设备
通信设备 车载设备 密钥 加密数据 非对称加密算法
3
致密油藏破裂压力与产量分类的预判方法及装置
致密油藏 压力 灰色关联分析 数据 支持向量回归算法
4
基于混合专家的视觉语言模型的令牌路由增强方法
令牌 视觉 负载均衡策略 序列 图像
5
基于多尺度时序特征融合的预约服务退单预测方法及装置
时序特征 预约平台 Attention机制 多尺度 订单
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号