摘要
本发明公开一种基于鸟瞰视图的多点位雷达相机融合检测方法,通过构建改进BEVDepth网络模型,利用稀疏但精确的雷达点,引入雷达辅助视图转换方法RVT将透视视图图像特征转换为鸟瞰视图BEV,弥补图像在深度感知上的不足,并为自动驾驶系统提供更加全面的空间理解。使用多模态可变形注意力机制,进一步聚合BEV中的图像与雷达特征图,旨在消除不同传感器数据之间的空间错位,从而提高感知精度。在采用BEVDepth模型的基础上,对其训练、主干网络和主干网络末端进行了改进,融合雷达数据,增强网络的域不变性,增加了系统对3D目标的识别能力。
技术关键词
融合检测方法
雷达
上下文特征
动态门控
跨模态
相机
Sigmoid函数
全局平均池化
融合特征
通道
图像特征编码
权重分配策略
转换方法
权重分配机制
特征金字塔网络
场景上下文
语义
自动驾驶系统