摘要
本发明公开了一种基于高阶特征和注意力机制的多模态单目深度估计方法,包括:获取单目RGB图和对应的真实深度图,并对训练集中的单目RGB图进行数据增强处理;构造基于高阶特征和注意力机制的多模态单目深度估计网络模型,构建多模态单目深度估计网络模型的损失函数,利用划分好的训练集训练所述多模态单目深度估计网络模型,在训练过程的反向传播中,其中梯度值通过链式法则传递,并采用优化算法更新该网络模型的参数,通过多次迭代训练,逐渐收敛控制损失函数在训练数据上的值最小,获得最佳权重;将测试集中的图像输入至具有最佳权重的多模态单目深度估计网络模型中,获得RGB单目图对应的预测深度图。
技术关键词
单目深度估计方法
注意力机制
深度图
文本编码器
图像编码器
多模态
解码器单元
网络
迭代方法
训练集
数据
标记器
双线性
深度值
计算方法
系统为您推荐了相关专利信息
神经协同过滤
兴趣
融合注意力机制
项目
残差神经网络
电价预测方法
时间序列特征
LightGBM模型
变量
时序
漏洞
智能问答方法
智能问答系统
计算机设备
信息搜索技术