摘要
本发明公开了一种双目视差估计的通用深度学习方法,针对不同视差范围数据集迁移适应性差的问题,提出了一种具有高泛化能力的网络结构;通过学习从图像函数空间到视差函数空间的映射,模型支持自定义视差范围和多尺度训练,能够动态构建具备可变尺度和视差感知的代价几何体,同时引入Galerkin注意力机制,降低计算复杂度和显存消耗;本方法包括数据处理、多级特征提取、代价几何体构建、Galerkin注意力机制、特征聚合及迭代优化等核心步骤;结合本方法的实施实例,模型提升了视差估计的精度和可靠性,在多场景、多种分辨率下具备显著的适应性和推理效率。
技术关键词
深度学习方法
双目视差
注意力机制
门控循环单元
分辨率
坐标点
线性插值方法
沙漏模型
支持自定义
复杂度
上下文特征
上采样
场景
动态
图像缩放
残差网络
拉普拉斯
系统为您推荐了相关专利信息
融合特征
卡尔曼滤波算法
多模态特征
数据
上下文特征
智能操控方法
智能体模型
光学字符识别方法
手机
节点
短期负荷预测模型
负荷控制策略
调控管理系统
明文
物联网传感器
自动化生成系统
集成化平台
样本
专用模型
语义标签
药效动力学
药代动力学
深度学习方法
速率
药物输注