摘要
本发明涉及计算机视觉领域,尤其涉及一种无监督单目图像深度估计方法,包括以下步骤:输入图片(It,It‑1)到姿态估计网络得到Tt→t‑1姿态;输入图片It到深度估计网络得到深度图Dt;输入数据增强后的图片Ir和Is到深度估计网络得到伪深度图Dr和Ds;利用深度图Dt与Tt→t‑1通过扭曲重建得到重建图片I′t;利用重建图片I′t与原图片It的重建损失和语义分割掩码识别动态物体,对动态物体进行单独姿态估计后再次进行重建,得到重建图片;重建图片与目标图片生成重建损失,伪深度图与深度图生成自蒸馏损失。本发明通过重建损失与语义掩码识别动态物体并单独处理,分离运动减少干扰;引入自蒸馏损失利用伪标签增强监督,提升动态场景深度估计精度与模型泛化性。
技术关键词
动态物体
深度图
无监督
姿态估计
图片
编码器
解码器
动态场景深度
网络
蒸馏
图像
语义
采样点
特征提取模块
计算机视觉
坐标系
相机
双线性
深度值