摘要
本发明公开了基于多模态体素图像特征融合注意力的三维目标检测方法,涉及自动驾驶目标检测技术领域。本发明包括:构建基于Transformer的双域体素空间特征编码模块,分别对体素域特征和相机域特征进行对应特征查询编码,最大限度地利用不同模态特征信息,来获取预选框;构建多尺度深度拟预测模块,对不同模态特征信息进行有效编码并提取得到体素特征及图像空间特征,对体素特征及图像空间特征进行级联得到联立特征。本发明解决了当前多模态目标检测算法在进行特征级融合时,存在不同域特征之间缺乏准确的分配权重,从而出现匹配错位,并且造成数据损失,最终降低了目标检测精度的问题。
技术关键词
模态特征
注意力
网格特征
图像
多模态
相机
编码模块
语义特征
索引
多尺度
特征点
点云特征
级联
动态
编码器
空间特征提取
掩模
雷达校准
系统为您推荐了相关专利信息
智能机
老年人
音频
数据采集模块
ARMA时间序列
融合特征
违规告警方法
建设现场
海港码头
定位特征