摘要
本发明一种融合自监督语义学习的行人检测方法,具体包括以下步骤:获取并预处理行人数据图像;获取并预处理行人数据图像;将预处理的图像输入特征提取网络,得到初始检测特征图;将初始检测特征图输入自监督学习网络,输出最终检测特征图和正负原型对比损失;将最终检测特征图和正负原型对比损失输入检测器得到最终预测的类别与检测框。本发明增强了模型的显式上下文建模能力,为模型添加了对行人语义的额外监督,在多个维度上提升了模型的感知能力,在保证精度的同时增加更多的正样本。
技术关键词
检测器
原型
行人检测方法
混合匹配策略
特征提取网络
视觉特征
注意力
语义
标签
全局平均池化
Softmax函数
像素
样本
跨模态
特征切片
分层
匈牙利算法