摘要
一种基于多模态数据融合的目标检测方法,包括:数据预处理;构建目标检测网络;训练目标检测网络YOLOv8‑P2;生成不同模态的目标检测结果;将均为前视图方向的稀疏深度图像目标检测结果和自然图像的目标检测结果进行叠加并通过Soft‑NMS模型剔除冗余目标检测框,得到初次融合结果;将鸟瞰图像的目标检测结果通过基于K近邻算法的多输出回归模型进行坐标信息转换,转换成与稀疏深度图像以及自然图像视图方向相同(即前视图方向)的目标检测结果,然后与初次融合结果进行叠加并通过Soft‑NMS模型剔除冗余目标检测框,得到最终目标检测结果。本发明在处理鸟瞰图到前视图的坐标转换问题时,采用了基于K近邻的传统机器学习回归模型,简化了转换过程,减少了深度学习模型可能需要的大量计算资源。
技术关键词
鸟瞰图像
多模态数据融合
激光雷达点云数据
K近邻算法
训练集
网络
坐标系
冗余
深度学习模型
标签
像素点
样本
相机
物体