摘要
本发明涉及计算机视觉和深度学习技术领域,具体为一种基于潜在感知和分层融合的RGB‑D显著目标检测方法。以SMT和MobileNetV2为主干网分别提取RGB和深度特征;利用深度图与真值图生成潜在标签,监督深度质量估计模块输出的质量因子;将RGB与深度特征输入潜在感知交互模块;多尺度融合模块与位置感知融合模块,差异化融合不同层次多模态特征,挖掘模态互补性;通过分层细化解码器,对浅层和深层的融合特征采用差异化解码策略,结合语义指导与特征细化;最后将边缘信息融合到最终的显著图中。本发明充分挖掘多层次、多模态特征间的关联性和互补性,动态抑制低质量特征的影响,提升了显著目标检测的准确性和鲁棒性。
技术关键词
交叉注意力机制
多尺度特征提取
融合特征
深度图
图像
融合多模态特征
空间结构特征
上采样
全局平均池化
深度学习技术
因子
分层特征
特征提取模块
计算机视觉