一种基于Transformer的低空无人机多视感知方法

正文

推荐专利

申请号：CN202511508874

申请日期：2025-10-22

公开号：CN120976810A

公开日期：2025-11-18

类型：发明专利

摘要

本申请公开了一种基于Transformer的低空无人机多视感知方法，属于图像处理技术领域，包括：获取多个相机拍摄的图像；采用Depth Anything作为基础单目深度估计模型，获得每个图像对应的相对深度图，并采用视角自监督深度校正机制VAST校正相对深度图；基于校正后的相对深度图，利用Transformer驱动的动态尺度融合模型TDSF，将视觉深度与导航信息通过Transformer融合，动态估计得到最优尺度因子，并基于最优尺度因子，得到绝对深度图；基于绝对深度图，利用动态空间自注意力的稀疏视角BEV融合模型DSSA转换为BEV表征，得到最终的BEV特征图。该方法提高了三维感知的准确度。

技术关键词

低空无人机深度图导航传感器因子相机注意力校正机制单目深度估计坐标矩阵网络单元深度值动态像素点视角图像邻域前馈神经网络

一种基于Transformer的低空无人机多视感知方法

站点导航

APP 下载