摘要
本发明提出一种基于特征金字塔注意力的动态残差神经网络声源定位方法,通过动态卷积和注意力机制,结合局部卷积特征与全局上下文信息,提升了声音事件定位与检测的精度和鲁棒性。采用动态残差卷积网络作为骨干网络,将残差动态卷积替代了标准卷积,以增强特征提取能力;特征金字塔注意力模块通过三个子模块细化并整合骨干网络输出的特征图,这三个子模块包括维度对齐模块、金字塔空间注意力模块、金字塔通道注意力模块。在此基础上,模型引入双向门控循环单元用于增强对上下文信息的建模能力。最后,经过全连接层输出最终结果。
技术关键词
特征金字塔
声源定位方法
残差神经网络
注意力
门控循环单元
动态
短时傅里叶变换
对齐模块
多层次特征提取
加权特征
通道
网络模块
损失函数优化
多层级特征
特征提取能力
特征值
全局平均池化
系统为您推荐了相关专利信息
衰退预测方法
电池
seq2seq模型
轨迹预测方法
数学模型
货车
分级管控系统
大数据画像
多模态特征融合
分布式计算框架
粗糙度预测方法
输入神经网络模型
深度残差
训练特征
软阈值函数
注意力机制
脑电情感识别方法
数据
卷积模块
样本