摘要
本发明公开了多模态注意力感知与相邻尺度建模的RGB‑D显著目标检测方法,具体按照以下步骤:步骤1,数据预处理;步骤2,构建多模态注意力融合模块;步骤3,构建相邻尺度建模模块。本发明能够保证显著目标完整性的同时增强目标的边缘细节,采用两个具有多尺度池化的金字塔池变压器(P2T)作为多模态编码器,从两种模态中提取多尺度特征,多模态注意力融合模块,结合空间注意力、通道注意力、自注意力操作来挖掘两种模态之间的互补信息,并使用相同的前馈块来探索模态一致性。
技术关键词
多模态注意力
融合特征
双线性插值
执行矩阵乘法
模态特征
通道
分支
RGB特征
多模态信息
多尺度特征
模块
线索
复杂度
变量
级联
深度图
金字塔
系统为您推荐了相关专利信息
钢模板
剩余寿命预测模型
融合特征
数据处理单元
图像
无人机配件
采集无人机
注意力
特征描述符
深度残差神经网络
行走轨迹预测方法
盲人智能眼镜
环境嘈杂度
多模态数据分析
多模态特征