摘要
本发明公开了一种自监督深度估计网络训练方法、系统及存储介质,包括采集视频帧图像作为训练样本,并将训练样本划分为目标视图和源视图;将目标视图作为深度估计网络和语义分割网络的输入以及将源视图作为相机网络的输入进行训练,得到训练好的深度估计网络用于进行深度图估计,深度估计网络包括第一编码器和第一解码器,语义分割网络包括第二编码器和第二解码器;训练时采用的总损失函数包括特征向量对齐损失、垂直损失、光度损失和语义分割损失,特征向量对齐损失用于将两编码器输出的特征图进行方向对齐,垂直损失用于基于第二解码器输出的语义分割图促使第一解码器输出的深度图满足垂直一致性。
技术关键词
网络训练方法
语义分割网络
解码器
编码器
深度图
光度
视频帧
相机
分支
像素点
训练系统
重构
物体
坐标系
多阶段
层级
超参数
可读存储介质