摘要
本公开涉及一种基于动态不确定性的视觉深度估计模型的训练方法,该方法包括:获取训练集,训练集包含动态场景下时序帧对应的多组图像对;将训练集输入至待训练的视觉深度估计模型进行训练迭代,视觉深度估计模型包含:深度预测网络、位姿预测网络和语义分割网络;训练期间通过结合几何一致性自发现掩码和语义分割掩码综合确定待重构图像中各个像素点对应的动静对象状态;待重构图像为图像对中选择的一个图像;根据动静对象状态结合图像对的重构处理确定针对动态对象区域的目标损失函数。其中,在训练迭代的期间以降低目标损失函数为优化目标,训练完成的深度预测网络用于进行单目视觉深度估计,在动态场景下的推理准确性提升。
技术关键词
深度预测网络
语义分割网络
像素点
图像
矩阵
重构
语义标签
训练集
对象
动态场景
视觉
光度
元素
通信接口
存储器
数据获取模块
处理器