基于多模态体素图像特征融合注意力的三维目标检测方法

正文

推荐专利

申请号：CN202410879904

申请日期：2024-07-02

公开号：CN119049008A

公开日期：2024-11-29

类型：发明专利

摘要

本发明公开了基于多模态体素图像特征融合注意力的三维目标检测方法，涉及自动驾驶目标检测技术领域。本发明包括：构建基于Transformer的双域体素空间特征编码模块，分别对体素域特征和相机域特征进行对应特征查询编码，最大限度地利用不同模态特征信息，来获取预选框；构建多尺度深度拟预测模块，对不同模态特征信息进行有效编码并提取得到体素特征及图像空间特征，对体素特征及图像空间特征进行级联得到联立特征。本发明解决了当前多模态目标检测算法在进行特征级融合时，存在不同域特征之间缺乏准确的分配权重，从而出现匹配错位，并且造成数据损失，最终降低了目标检测精度的问题。

技术关键词

模态特征注意力网格特征图像多模态相机编码模块语义特征索引多尺度特征点点云特征级联动态编码器空间特征提取掩模雷达校准

系统为您推荐了相关专利信息

用于老年人群的智能机描述故障识别辅助处理方法及系统

智能机老年人音频数据采集模块 ARMA时间序列

基于音频和图像的人脸伪造识别方法、装置、设备及介质

伪造识别方法人脸图像音频感知损失函数

一种智能药盒中药物的耐受性评估系统及方法

智能药盒生理融合特征患者图谱

一种用于汽车喷涂车衣的智能机器人的控制系统及其控制方法、应用

智能机器人喷涂组件车辆喷涂模板扫描组件

一种海港码头建设现场的违规告警方法及系统

融合特征违规告警方法建设现场海港码头定位特征

基于多模态体素图像特征融合注意力的三维目标检测方法

站点导航

APP 下载