摘要
本发明属于计算机视觉领域,具体涉及一种非对称交叉融合的RGBD图像语义分割方法,其包括如下步骤:步骤一:准备训练数据,数据包括RGB图像与深度图像;步骤二:RGB图像和深度图像经过基础特征提取器后,得到它们各自的基础特征图,随后,通过非对称特征增强校正模块对这两种基础特征图进行进一步的完善校正,以获取增强特征图,接下来,经过非对称交叉融合模块将两种增强特征图融合在一起,以更全面地捕捉图像的信息,最终,融合后的特征经过解码器,通过解码操作得到语义分割的结果;步骤三:构建解码器,完成预测并输出结果;本发明针解决了模态之间产生的噪声与RGB图像和深度图像缺乏互补性的问题,从而产生效果更完整的分割图像。
技术关键词
图像语义分割方法
非对称特征
校正模块
解码器
sigmoid函数
多层感知机
重构模块
图像特征提取
特征提取器
通道
交叉注意力机制
图像多尺度
基础
预训练模型
分支
计算机视觉