摘要
本发明属于计算机视觉技术领域,具体的说是一种基于注意力与CNN的高效单目深度估计方法及系统,系统网络架构包括:编码器,采用级联方式对Transformer分支模块和轻量化CNN分支模块进行融合;融合模块能够聚合CNN层的局部特征与来自Transformer层的全局特征;特征金字塔模块其利用多尺度特征融合和自顶向下与横向连接进行特征聚合;解码器采用轻量化加性注意力机制来实现编码多尺度特征和解码模块的融合;Bins预测模块通过将深度范围划分为多个区间实现深度的分类回归;本发明网络聚合Transformer的长程相关性和轻量化CNN的局部特征提取能力,在深度预测时结合局部细节和远距离关系实现精准预测。
技术关键词
瓶颈特征
单目深度估计方法
多尺度特征融合
特征金字塔
注意力机制
上采样
分支
卷积模块
解码模块
解码器
级联方式
高层语义信息
种子
网络架构
局部特征提取
编码器特征
系统为您推荐了相关专利信息
存储数据隔离方法
概率密度曲线
邻域特征
模式
大数据平台
超声心动图
分割模型训练方法
图像编码器
心脏
生成训练数据
病害识别方法
叶片
多尺度特征融合
输出特征
深度学习框架
光伏功率预测方法
动态变化特征
天气
卫星云图
条件生成对抗网络