一种多尺度自适应特征融合的声音事件定位与检测方法

AITNT
正文
推荐专利
一种多尺度自适应特征融合的声音事件定位与检测方法
申请号:CN202411892219
申请日期:2024-12-20
公开号:CN119724238A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种多尺度自适应特征融合的声音事件定位与检测方法,对待检测的多通道音频信号进行预处理,生成Mel谱图并计算有效强度向量,构建输入特征矩阵并输入编码器进行多尺度特征提取,输出多层空间特征;通过选择性频率感知特征融合模块对多层空间特征进行频率自适应调节,平滑全局特征并增强边界细节。使用分层多尺度特征集成模块对浅层特征与深层特征进行融合,并结合双向门控循环单元进行时间建模,输出检测结果。本发明能够解决多源重叠声源干扰、噪声影响下的定位不稳定性、边界模糊引起的检测精度下降问题,以及特征混淆导致的时间频率细节丢失问题,能够显著提升定位和检测性能。
技术关键词
门控循环单元 感知特征 多尺度特征提取 集成模块 编码器 高通滤波器 频率 低通滤波器 抑制高频噪声 语义信息提取 深层特征提取 短时傅里叶变换 多通道 融合特征 矩阵 特征金字塔 融合全局
系统为您推荐了相关专利信息
1
一种基于深度学习的电动车电池寿命预测方法
电池寿命预测方法 驾驶习惯数据 引入注意力机制 电池健康状态 电池剩余使用寿命
2
一种融合WTNet模型的岩质边坡弱纹理特征高精度识别方法
纹理特征 高精度识别方法 边界特征 Sigmoid函数 感知特征
3
基于SAD-Net网络的频域图像去雾方法、系统、介质、程序产品及终端
图像去雾方法 Sigmoid函数 图像去雾模型 小波变换处理 去雾图像
4
一种基于多生命体征时序数据的健康状态预测方法
健康状态预测方法 输出特征 注意力 编码器模块 时序
5
滑坡图像识别方法、系统、设备及介质
图像识别方法 语义特征 融合特征 多尺度特征提取 输出特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号