一种多尺度自适应特征融合的声音事件定位与检测方法

正文

推荐专利

申请号：CN202411892219

申请日期：2024-12-20

公开号：CN119724238A

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开了一种多尺度自适应特征融合的声音事件定位与检测方法，对待检测的多通道音频信号进行预处理，生成Mel谱图并计算有效强度向量，构建输入特征矩阵并输入编码器进行多尺度特征提取，输出多层空间特征；通过选择性频率感知特征融合模块对多层空间特征进行频率自适应调节，平滑全局特征并增强边界细节。使用分层多尺度特征集成模块对浅层特征与深层特征进行融合，并结合双向门控循环单元进行时间建模，输出检测结果。本发明能够解决多源重叠声源干扰、噪声影响下的定位不稳定性、边界模糊引起的检测精度下降问题，以及特征混淆导致的时间频率细节丢失问题，能够显著提升定位和检测性能。

技术关键词

门控循环单元感知特征多尺度特征提取集成模块编码器高通滤波器频率低通滤波器抑制高频噪声语义信息提取深层特征提取短时傅里叶变换多通道融合特征矩阵特征金字塔融合全局

系统为您推荐了相关专利信息

一种基于深度学习的电动车电池寿命预测方法

电池寿命预测方法驾驶习惯数据引入注意力机制电池健康状态电池剩余使用寿命

一种融合WTNet模型的岩质边坡弱纹理特征高精度识别方法

纹理特征高精度识别方法边界特征 Sigmoid函数感知特征

基于SAD-Net网络的频域图像去雾方法、系统、介质、程序产品及终端

图像去雾方法 Sigmoid函数图像去雾模型小波变换处理去雾图像

一种基于多生命体征时序数据的健康状态预测方法

健康状态预测方法输出特征注意力编码器模块时序

滑坡图像识别方法、系统、设备及介质

图像识别方法语义特征融合特征多尺度特征提取输出特征

一种多尺度自适应特征融合的声音事件定位与检测方法

站点导航

APP 下载