摘要
本发明公开了基于多模态融合网络的公路场景中三维车辆检测方法,包括:构建了区分前后景,并且同时考虑实例深度与遮挡信息的Cross Modal GT‑AUG模块,更加真实的模拟现实场景的跨模态数据增强过程;构建了图像与Lidar BEV的Cross Modal Multi‑Head‑Attention模块,有效的弥补了高分辨特征中grained information,同时增强了图像中的信息表示;构建了适用于公路场景的MMFN‑PVA‑VDHS模型,在Nuscenes和Nuscenes‑C混合数据集上验证了模型的性能,可以有效的解决场景中抖动导致的跨模态特征不对齐问题。本发明的有益效果在于:能够有效对公路场景车辆进行检测,解决特征不对齐导致的检测精度下降的问题。
技术关键词
三维车辆检测方法
多模态
模拟现实场景
图像
注意力
高速公路场景
高分辨特征
检测网络模型
雷达
像素补偿
对象
查询特征
数据
对齐模块
模态特征
系统为您推荐了相关专利信息
健康状态评估方法
工业机器人设备
多模态
下工业机器人
退化模型
信号抑制方法
多径
时间序列特征
注意力机制
融合特征
会话推荐方法
兴趣
概率估计方法
物品流行度
列表
盲人导航方法
深度预测模型
传感器特征
混合网络
图像检测模型