基于动态不确定性的视觉深度估计模型的训练方法及装置

正文

推荐专利

申请号：CN202510597669

申请日期：2025-05-09

公开号：CN120451242A

公开日期：2025-08-08

类型：发明专利

摘要

本公开涉及一种基于动态不确定性的视觉深度估计模型的训练方法，该方法包括：获取训练集，训练集包含动态场景下时序帧对应的多组图像对；将训练集输入至待训练的视觉深度估计模型进行训练迭代，视觉深度估计模型包含：深度预测网络、位姿预测网络和语义分割网络；训练期间通过结合几何一致性自发现掩码和语义分割掩码综合确定待重构图像中各个像素点对应的动静对象状态；待重构图像为图像对中选择的一个图像；根据动静对象状态结合图像对的重构处理确定针对动态对象区域的目标损失函数。其中，在训练迭代的期间以降低目标损失函数为优化目标，训练完成的深度预测网络用于进行单目视觉深度估计，在动态场景下的推理准确性提升。

技术关键词

深度预测网络语义分割网络像素点图像矩阵重构语义标签训练集对象动态场景视觉光度元素通信接口存储器数据获取模块处理器

基于动态不确定性的视觉深度估计模型的训练方法及装置

站点导航

APP 下载