摘要
本发明属于计算机视觉技术领域,尤其涉及一种偏振引导的扩散模型单目深度估计方法。本发明首次将偏振图像整合至单目深度估计的框架中,设计了一个可学习的轻量置信度预测器,并基于预测的置信度在潜在空间的层面对RGB图像与偏振图像进行门控融合,从而对二者的信息进行了合理的整合,实现对无纹理、高反射、透明表面等复杂场景更加准确的深度估计。与当前最先进的方法相比,本发明提出的方案通过显式建模偏振模态和RGB模态在潜在特征空间中的互补性,引导网络根据区域置信度进行动态信息加权。在不显著增加推理成本的前提下,展现出更加优异的性能与视觉质量,尤其在无纹理、高反射、透明表面等复杂区域展现出了更好的结构完整性。
技术关键词
单目深度估计方法
深度值
浅层卷积神经网络
编码器
随机噪声
融合策略
场景
优化网络参数
计算机视觉技术
噪声方差
彩色图像
纹理
解码器
重构