摘要
本发明公开了一种基于注意力机制的ResNet声源定位方法,涉及声源定位技术领域;其包括如下步骤:获取声源信号,声源信号包括麦克风阵列中每一麦克风的声源信号,将声源信号经短时傅里叶变换至频域,在频域内提取获得麦克风声源信号的相位分量,将每两个麦克风之间的相位分量做差得到相位差,将相位差图馈入训练好的基于改进注意力机制的残差网络,网络输出声源角度预测概率;残差网络包括依次连接的ResNet‑34 Stage1~4、第一输出部分、SC‑SEAM模块、ResNet‑34 Stage5、SC‑SEAM模块、第二输出部分、全连接层以及输出层,该残差网络为改进后的神经网络结构,声源定位精度更高,鲁棒性更好。
技术关键词
声源定位方法
残差网络
通道注意力机制
麦克风阵列
短时傅里叶变换
声源定位技术
信号
模块
神经网络结构
输出特征
鲁棒性
参数
幅值
因子
频率
系统为您推荐了相关专利信息
远程智能监控方法
远程智能监控设备
电视监控设备
视频采集模块
主控芯片
心电信号分类
十二导联心电图
时域特征
融合特征
知识蒸馏方法
动作生成方法
特征提取模块
机械臂末端执行器
深度残差网络
生成动作
重构方法
DBSCAN聚类算法
点云
神经网络模型
笛卡尔坐标系
分支
掩膜
分层特征
多尺度特征提取
通道注意力机制