摘要
本发明提供一种基于GAN的无监督的立体匹配方法,涉及计算机视觉识别的技术领域,本发明的方法中,特征感知模块结合了残差结构和空洞金字塔卷积操作,能够在不同尺度上捕捉到图像的上下文信息;接下来将图像输入至特征引导模块中,通过调整权重强调不同特征的重要性,可以帮助网络动态的调整关注区域,并有效的融合不同层级间的特征,解码器结合了多尺度学习框架和由粗到细的策略,通过这种迭代的方式,模型可以逐步提高估计的精度,并解决由于分辨率较低引起的对齐问题;在训练时,前、后半周期两轮的训练构成整周期训练,类似循环结构,使网络既能从训练集真实图像学习,也从合成图像学习,这样可以提高模型的泛化能力和鲁棒性。
技术关键词
立体匹配方法
注意力
图像重建
编码器模块
计算机视觉识别
图像类别
残差结构
子模块
解码器结构
金字塔
分辨率
相机
因子
通道
语义特征
输出特征
网络
空洞
系统为您推荐了相关专利信息
抓取方法
图像显著性区域
非结构化场景
多模态注意力
点云特征提取
风险识别方法
注意力机制
通道
Softmax函数
矩阵
医学图像分割模型
注意力
医学图像分割方法
上采样
图像块