摘要
本发明公开了一种基于Transformer的无人机3D目标检测多模态融合方法,包括通过搭载于无人机上的摄像头获取图像,并通过雷达传感器获取雷达点云数据;构建多分辨率注意力模块,并将其整合到主干网络;多分辨率注意力模块基于所获取的图像以及雷达点云数据分别提取体素图像特征并建立不同的体素空间;通过Transformer网络将多个体素空间内的体素图像特征进行融合。本申请将摄像头图像和雷达点云数据处理成统一的体素空间表示,进一步通过编码器网络进行细化,以增强空间交互并减少语义歧义,同时结合了具有多头自注意力和交叉注意力机制的Transformer解码器网络,通过全局交互促进了识别对象和编码器特征之间的稳健和准确检测,从而可以高效准确地实现无人机3D目标检测任务。
技术关键词
多模态融合方法
多分辨率
无人机
交叉注意力机制
图像
雷达点云数据分割
雷达传感器
网络
点云数据处理
编码器特征
解码器
生成多尺度
多尺度特征
模块
线性单元
语义
系统为您推荐了相关专利信息
清洁方法
模糊特征
检测传感器
路面反光
点云密度
深度学习算法
施工智能
无人机巡检
工作机器
推荐方法
细粒度图像分类
纹理特征
识别方法
灰度共生矩阵
灰度直方图
智能感知方法
影像
模拟井下工况
特征提取网络
煤矿智能化开采技术
日期识别方法
生成对抗网络模型
联合估计算法
OCR识别模型
边缘检测