摘要
本发明公开了一种多尺度自适应特征融合的声音事件定位与检测方法,对待检测的多通道音频信号进行预处理,生成Mel谱图并计算有效强度向量,构建输入特征矩阵并输入编码器进行多尺度特征提取,输出多层空间特征;通过选择性频率感知特征融合模块对多层空间特征进行频率自适应调节,平滑全局特征并增强边界细节。使用分层多尺度特征集成模块对浅层特征与深层特征进行融合,并结合双向门控循环单元进行时间建模,输出检测结果。本发明能够解决多源重叠声源干扰、噪声影响下的定位不稳定性、边界模糊引起的检测精度下降问题,以及特征混淆导致的时间频率细节丢失问题,能够显著提升定位和检测性能。
技术关键词
门控循环单元
感知特征
多尺度特征提取
集成模块
编码器
高通滤波器
频率
低通滤波器
抑制高频噪声
语义信息提取
深层特征提取
短时傅里叶变换
多通道
融合特征
矩阵
特征金字塔
融合全局
系统为您推荐了相关专利信息
电池寿命预测方法
驾驶习惯数据
引入注意力机制
电池健康状态
电池剩余使用寿命
纹理特征
高精度识别方法
边界特征
Sigmoid函数
感知特征
图像去雾方法
Sigmoid函数
图像去雾模型
小波变换处理
去雾图像
健康状态预测方法
输出特征
注意力
编码器模块
时序
图像识别方法
语义特征
融合特征
多尺度特征提取
输出特征