摘要
本发明公开了一种基于解耦对比学习的RGB‑D显著目标检测方法,结合多模态建模中的结构异质性问题,利用深度模态的频域结构优势与Transformer的长距离建模能力,设计了融合表达增强、模态协同感知与结构判别学习一体化的显著性检测框架。通过引入小波卷积与Transformer联合建模、跨模态交互并行融合机制以及像素级结构感知对比学习策略,实现了对复杂场景中显著目标区域的高精度、多尺度、边界清晰检测。本发明能够有效解决RGB与深度图模态间信息差异大、结构对齐难、边界预测模糊、特征表达能力弱等问题,显著提升了显著区域的语义一致性与结构完整性,并具备良好的跨模态泛化能力与鲁棒性。
技术关键词
像素
融合特征
注意力
跨模态
多尺度语义特征
计算机存储介质
存储计算机程序
深度图
计算机程序产品
线性变换矩阵
图像
边缘检测
RGB特征
多尺度结构
处理器
样本
边界结构
编码机制
存储器
网络
系统为您推荐了相关专利信息
视觉检测方法
实例分割模型
汽车线束
HSV颜色空间
边缘轮廓
ESD晶体管
显示驱动芯片
ESD结构
像素电路
面板
红外焦平面阵列
LSTM模型
姿态估计方法
分块
姿态角估计
嵌入特征
措施
推荐方法
GCN模型
训练语言模型
降水预报方法
地形特征
动态卷积网络
前馈神经网络
数据