一种基于Transformer的无人机3D目标检测多模态融合方法

正文

推荐专利

申请号：CN202411034907

申请日期：2024-07-31

公开号：CN118837875A

公开日期：2024-10-25

类型：发明专利

摘要

本发明公开了一种基于Transformer的无人机3D目标检测多模态融合方法，包括通过搭载于无人机上的摄像头获取图像，并通过雷达传感器获取雷达点云数据；构建多分辨率注意力模块，并将其整合到主干网络；多分辨率注意力模块基于所获取的图像以及雷达点云数据分别提取体素图像特征并建立不同的体素空间；通过Transformer网络将多个体素空间内的体素图像特征进行融合。本申请将摄像头图像和雷达点云数据处理成统一的体素空间表示，进一步通过编码器网络进行细化，以增强空间交互并减少语义歧义，同时结合了具有多头自注意力和交叉注意力机制的Transformer解码器网络，通过全局交互促进了识别对象和编码器特征之间的稳健和准确检测，从而可以高效准确地实现无人机3D目标检测任务。

技术关键词

多模态融合方法多分辨率无人机交叉注意力机制图像雷达点云数据分割雷达传感器网络点云数据处理编码器特征解码器生成多尺度多尺度特征模块线性单元语义

系统为您推荐了相关专利信息

自动驾驶传感器的清洁方法、系统、设备及存储介质

清洁方法模糊特征检测传感器路面反光点云密度

基于无人机巡检与深度学习算法的道路施工智能推荐方法

深度学习算法施工智能无人机巡检工作机器推荐方法

一种基于细粒度图像分类的井下软硬煤识别方法

细粒度图像分类纹理特征识别方法灰度共生矩阵灰度直方图

一种基于煤矸运移态势热敏影像智能感知方法和系统

智能感知方法影像模拟井下工况特征提取网络煤矿智能化开采技术

一种业扩工单手写日期识别方法及系统

日期识别方法生成对抗网络模型联合估计算法 OCR识别模型边缘检测

一种基于Transformer的无人机3D目标检测多模态融合方法

站点导航

APP 下载