摘要
本申请提供本发明提供了一种基于改进BEVFormer的三维目标检测方法,包括使用ResNet‑101+FPN提取多尺度图像特征、使用PointPillars配合FPN提取多尺度雷达特征,通过图像时间自注意力和空间交叉注意力将图像特征聚合到BEV空间得到当前时刻的图像BEV表征,然后在图像BEV的基础之上,通过雷达时间自注意力和空间交叉注意力将雷达特征聚合到BEV空间,得到最终统一的BEV表征。
技术关键词
注意力
雷达
执行图像数据
生成多尺度
相机
特征金字塔
采样点
视角
上采样
编码
矩阵
坐标系
点云
基础
视野
语义
网格
系统为您推荐了相关专利信息
协方差矩阵
量测噪声
期望最大化算法
跟踪方法
跟踪系统
实时语音
语义解析方法
注意力编码器
预训练语言模型
车载麦克风
偏振分束器
平衡探测器
调频连续波激光雷达
现场可编程门阵列
光学收发系统
视觉传感器
激光雷达
车载环境感知传感器
点云缺失
数据