摘要
本发明公开了一种基于改进注意力机制的风险源多尺度识别方法,涉及图像识别领域,具体步骤为:该方法首先获取预设数量的且已标注风险源类型标签的烟火图像数据集;其次,通过特征金字塔网络与路径聚合网络以及跨阶段局部网络组合结构,有效提取和融合多尺度特征信息;随后,利用Vision Transformer模型对特征图进行图块分割,并通过改进的多头自注意力机制、通道注意力机制和空间注意力机制,实现图像全局语义特征的精准建模与跨维度特征的高效融合。本发明能够在不同环境下准确检测“小目标”风险源和“形态不规则”风险源,有效提升风险源检测的准确性和鲁棒性。
技术关键词
特征提取模块
风险源识别
特征金字塔
识别方法
融合特征
烟火
生成多尺度
图像
通道注意力机制
网络模块
输出模块
编码模块
语义特征
融合多尺度特征