多模态注意力感知与相邻尺度建模的RGB-D显著目标检测方法

AITNT
正文
推荐专利
多模态注意力感知与相邻尺度建模的RGB-D显著目标检测方法
申请号:CN202410892941
申请日期:2024-07-04
公开号:CN118823536A
公开日期:2024-10-22
类型:发明专利
摘要
本发明公开了多模态注意力感知与相邻尺度建模的RGB‑D显著目标检测方法,具体按照以下步骤:步骤1,数据预处理;步骤2,构建多模态注意力融合模块;步骤3,构建相邻尺度建模模块。本发明能够保证显著目标完整性的同时增强目标的边缘细节,采用两个具有多尺度池化的金字塔池变压器(P2T)作为多模态编码器,从两种模态中提取多尺度特征,多模态注意力融合模块,结合空间注意力、通道注意力、自注意力操作来挖掘两种模态之间的互补信息,并使用相同的前馈块来探索模态一致性。
技术关键词
多模态注意力 融合特征 双线性插值 执行矩阵乘法 模态特征 通道 分支 RGB特征 多模态信息 多尺度特征 模块 线索 复杂度 变量 级联 深度图 金字塔
系统为您推荐了相关专利信息
1
钢模板剩余寿命的预测方法和装置
钢模板 剩余寿命预测模型 融合特征 数据处理单元 图像
2
终端设备远程维护方法、装置、设备和计算机存储介质
光流特征 视频帧特征 挖掘算法 关系 终端设备
3
基于双向MRC和双跨度的方面情感三元组抽取方法与系统
三元组 跨度 依赖特征 标志 推理方法
4
基于传感器的无人机配件智能识别与存取方法及系统
无人机配件 采集无人机 注意力 特征描述符 深度残差神经网络
5
一种基于图像识别的盲人行走轨迹预测方法
行走轨迹预测方法 盲人智能眼镜 环境嘈杂度 多模态数据分析 多模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号