摘要
一种基于多阶局部和全局融合网络的声音事件定位与检测方法,由数据集预处理、特征提取、构建多阶局部和全局融合网络、训练多阶局部和全局融合网络、测试多阶局部和全局融合网络、定位和检测声音事件步骤组成。本发明采用了多阶局部和全局融合网络,提取空间多阶特征信息的同时,使用局部卷积块提取局部特征信息,使用全局Transformer块捕获上下文特征信息,并根据局部特征和上下文特征的重要性进行自适应地融合,增强了特征的多样性,提高了特征的表达能力,克服了卷积循环神经网络提取特征不充分的问题。本发明具有识别准确率高、定位误差小、提取特征信息完整等优点,可用于声音事件定位与检测。
技术关键词
注意力
分支
线性单元
动态
矢量特征
积层
多尺度
度函数
频谱特征
卷积循环神经网络
上下文特征
Softmax函数
笛卡尔
局部特征信息
短时傅里叶变换
门控循环单元
全局平均池化
级联
声音类别
系统为您推荐了相关专利信息
新能源发电设备
网络拓扑结构
故障诊断方法
动态数据集
偏差
数据集构建方法
人机协同
标签
大语言模型
社交媒体平台