基于对比学习的跨模态双目视觉深度估计方法

AITNT
正文
推荐专利
基于对比学习的跨模态双目视觉深度估计方法
申请号:CN202510731286
申请日期:2025-06-03
公开号:CN120953344A
公开日期:2025-11-14
类型:发明专利
摘要
一种基于对比学习的跨模态双目视觉深度估计方法,包括以下步骤:收集单目对齐的跨模态图像数据,通过多模态相机系统采集RGB图像与非RGB图像,并进行严格的相机校准以实现像素级别的对齐;构造跨模态双目数据生成模型,基于单目对齐的跨模态图像数据生成符合标准的双目图像数据,包括基于深度的视差变换和边缘感知修复模块;构建跨模态双目深度估计模型,引入基于对比学习的特征预训练和监督约束优化,使用对齐单目跨模态数据集和生成的跨模态双目数据集进行训练;保存训练参数,根据输入的跨模态双目数据生成视差图像。本发明通过生成跨模态数据提升双目深度估计模型的准确性,确保从模型和生成数据的角度实现跨模态深度估计方法的稳定性提升。
技术关键词
双目深度估计 视觉深度估计方法 跨模态数据 数据生成模型 生成视差图像 相机校准 深度估计系统 相机系统 子系统 单目深度估计 跨模态图像 多模态 编码器架构 生成多尺度 矩阵 边缘检测
系统为您推荐了相关专利信息
1
一种基于半监督学习的铜管质量检测方法及系统
半监督学习 铜管 图像 深度卷积神经网络 标记
2
分析模型训练数据生成方法与电子设备
数据生成模型 训练数据生成方法 指令 数据更新 人工智能模型
3
电力高空作业违章检测方法
图像 违章检测方法 电力高空作业 背光 卡尔曼滤波算法
4
基于多模态存储的漏缆告警趋势分析系统
趋势分析系统 地理围栏 时序 存储集群 分层策略
5
一种基于跨模态知识融合的联邦学习大小模型协同优化方法
协同优化方法 文本生成图像 调用API接口 客户端 服务端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号