摘要
本发明公开了无人机视角下大景深场景的单目深度估计方法。该方法包括:构建目标卷积神经网络,其中,目标卷积神经网络包括Transformer分支、Convolution分支、注意力机制增强模块、多尺度融合模块、若干个上采样模块和若干个特征相加模块;获取目标图像,其中,目标图像为无人机任意视角下的大景深场景图像;将目标图像分别输入至Transformer分支和Convolution分支,得到Transformer分支的四个Transformer层输出的四个不同尺寸的特征和Convolution分支输出的特征,其中,Transformer分支包含若干个Transformer层,Convolution分支为ResNet50编码器。本发明解决了现有技术中无人机视角下大景深场景的单目深度预测不准确的技术问题。
技术关键词
注意力机制
单目深度估计方法
上采样
分支
输出特征
图像
模块
计算机可执行指令
无人机
景深
多尺度
矩阵
深度图
视角
融合特征
尺寸
场景
编码器
分区模型
可读存储介质
系统为您推荐了相关专利信息
深度学习识别模型
注意力机制
识别方法
深度学习模型
样本
情感判别方法
注意力机制
情感分析模型
文本
概念
深度学习分类模型
二值化图像
多尺度信息
视野
多尺度特征融合
开发方法
预测系统
分类器集成方法
分布式计算框架
元学习算法