摘要
本申请公开了一种基于Transformer的低空无人机多视感知方法,属于图像处理技术领域,包括:获取多个相机拍摄的图像;采用Depth Anything作为基础单目深度估计模型,获得每个图像对应的相对深度图,并采用视角自监督深度校正机制VAST校正相对深度图;基于校正后的相对深度图,利用Transformer驱动的动态尺度融合模型TDSF,将视觉深度与导航信息通过Transformer融合,动态估计得到最优尺度因子,并基于最优尺度因子,得到绝对深度图;基于绝对深度图,利用动态空间自注意力的稀疏视角BEV融合模型DSSA转换为BEV表征,得到最终的BEV特征图。该方法提高了三维感知的准确度。
技术关键词
低空无人机
深度图
导航传感器
因子
相机
注意力
校正机制
单目深度估计
坐标
矩阵
网络单元
深度值
动态
像素点
视角
图像
邻域
前馈神经网络
系统为您推荐了相关专利信息
动力冲浪板
自主导航方法
运动员
轨迹
无人机系统
发电机盖板
大型水电站
清扫机器人
智能控制方法
智能控制系统
信号调制识别
深度学习模型
对抗性
样本
残差网络
头戴式设备
风险预警方法
预测运动轨迹
速度因子
障碍物类别