摘要
本发明公开了一种基于双向跨模态注意力的雷达/相机融合3D目标检测方法,首先将原始的图像数据输入特征提取器,对图像特征进行增强后,压缩到BEV空间中;将原始的点云数据体素化,输入特征提取器后,压缩至BEV空间中,进行特征增强;再利用双向跨模态注意力机制对BEV空间中的点云特征和图像特征进行自适应加权融合;最后将融合后的特征输入3D目标检测任务头,获得3D目标检测结果。本发明方法将注意力机制应用于自适应融合框架中,针对不同模态的点云数据和图像数据进行自适应加权融合,能在3D目标检测任务中提供准确、可靠的检测结果,具有较好的适应性;本发明系统也兼具检测精度和鲁棒性的双重优势,符合实际需求。
技术关键词
跨模态
图像特征提取
深度特征信息
特征金字塔网络
注意力机制
相机
多尺度语义特征
特征提取器
激光雷达点云数据
残差网络
语义信息提取
注意力方法
原始图像数据
全局平均池化
系统为您推荐了相关专利信息
神经网络模型
数据输出模块
融合特征
多头注意力机制
池化特征
视频检索方法
智能数据库
场景切换点
大数据技术
跨模态
图文检索方法
语义
文本
嵌入特征
多头注意力机制
编码器
Sinc函数
音频特征提取
更新网络参数
小波散射网络