摘要
一种基于对比学习的跨模态双目视觉深度估计方法,包括以下步骤:收集单目对齐的跨模态图像数据,通过多模态相机系统采集RGB图像与非RGB图像,并进行严格的相机校准以实现像素级别的对齐;构造跨模态双目数据生成模型,基于单目对齐的跨模态图像数据生成符合标准的双目图像数据,包括基于深度的视差变换和边缘感知修复模块;构建跨模态双目深度估计模型,引入基于对比学习的特征预训练和监督约束优化,使用对齐单目跨模态数据集和生成的跨模态双目数据集进行训练;保存训练参数,根据输入的跨模态双目数据生成视差图像。本发明通过生成跨模态数据提升双目深度估计模型的准确性,确保从模型和生成数据的角度实现跨模态深度估计方法的稳定性提升。
技术关键词
双目深度估计
视觉深度估计方法
跨模态数据
数据生成模型
生成视差图像
相机校准
深度估计系统
相机系统
子系统
单目深度估计
跨模态图像
多模态
编码器架构
生成多尺度
矩阵
边缘检测
系统为您推荐了相关专利信息
数据生成模型
训练数据生成方法
指令
数据更新
人工智能模型
图像
违章检测方法
电力高空作业
背光
卡尔曼滤波算法
协同优化方法
文本生成图像
调用API接口
客户端
服务端