摘要
本发明提供一种基于全局‑局部特征的行人检测方法,具体包括以下步骤:将待检测图像输入到Swin‑Transformer模型中,获取全局特征信息;将全局特征信息输入到含有可变形注意力机制的特征金字塔提取器,捕捉待检测图像的局部特征,并输出不同分辨率的融合特征图;将不同分辨率的融合特征图输入由多头注意力机制组成的特征提取块,得到的不同分辨率最终特征图输入到检测头中,以获取初步的行人检测结果;通过非极大值抑制模块去除初步的行人检测结果对应的冗余检测框,得到最终的行人检测结果。本发明相较于现有的行人检测模型,可以有效捕捉更为丰富的人体视觉特征,从而能够对行人进行有效检测。
技术关键词
行人检测方法
网络模块
融合特征
多头注意力机制
联合注意力机制
输出特征
可变形卷积层
特征金字塔
阶段
分辨率
全局平均池化
Sigmoid函数
行人检测模型
多路径
上采样
处理器