摘要
本发明公开了一种基于运动投影仿真的自监督多模态图像光流估计方法。方法包括:使用跨模态数据对集进行深度估计,结合仿真运动参数生成仿真同模态数据对集及仿真光流真值;建立跨模态感知特征提取器,并使用跨模态数据对集和仿真同模态数据对集获得模态无关一致性特征,进而通过光流估计网络构建训练损失函数以训练整体的光流估计校正模型;通过待校正的不同模态的图像对获得光流估计结果后,对原始图像对进行校正。本发明方法解决了多模态图像因模态差异及标注数据稀缺导致的光流估计精度低、泛化能力差的问题,无需人工标注光流真值,显著降低对标注数据的依赖,在遥感监测、自动驾驶等领域实现了高精度、高泛化性的多模态光流估计。
技术关键词
图像光流估计方法
感知特征
特征提取器
多模态
跨模态数据
网络
像素点
光度
校正
运动
单目深度估计
跨模态图像
采样模块
坐标
相机外参
矩阵