摘要
本发明公开了一种基于递进层级融合的RGB‑D图像显著性目标检测方法,包括步骤如下:将预处理好的RGB图像和深度图像输入到Swin Transformer骨干网中,分别提取RGB和深度图像的模态特征;将提取的最后一层特征输入到多尺度增强模块,捕获高层语义信息的上下文信息;将骨干网提取的前三层特征以及最后增强后的高层特征分别输入到多模态融合模块中,融合RGB和深度特征;解码器阶段采用多层解码结构,从上到下不断整合高层特征和低层特征,并采用残差连接保留原始信息;采用边缘增强模块提取深度低层边缘轮廓。本发明充分挖掘跨模态特征之间的互补信息,有效融合跨层次特征,能够生成完整、清晰的显著性图。
技术关键词
RGB特征
层级
全局平均池化
融合特征
模块
空洞
多尺度
图像编码器
解码结构
边界特征
解码器
深度特征学习
深度特征信息
模态特征
高层语义信息
通道注意力机制
级联
深度编码器
系统为您推荐了相关专利信息
序列编码方法
位置特征信息
注意力
线性变换矩阵
病毒
轨迹跟踪控制系统
船舶运动数学模型
船舶轨迹跟踪控制
扰动观测器
事件触发机制
大语言模型
特征提取能力
客服
样本
特征提取模块