摘要
本发明公开了一种复杂场景下基于混合注意力的显著性目标检测方法及系统,涉及计算机视觉和图像处理技术领域,该方法包括步骤:将RGB图像和深度图像分别输入编码器提取不同层级的图像特征;对不同层级的深度图像特征进行特征增强,过滤掉冗余信息;将RGB图像特征与增强的深度特征根据对应层级基于混合注意力机制进行跨模态交互融合;将不同层级的特征图从高级到低级进行跨尺度融合,逐级解码得到跨尺度融合后的不同层级的显著特征图;调整不同层级的显著特征图的大小和通道,将最低层级的显著特征图作为显著性目标检测的结果。该方法的优势在于能够有效地应对比较复杂的场景,并且能够准确的检测到显著物体。
技术关键词
层级
注意力机制
多模态特征
场景
跨模态
Softmax函数
可读存储介质
混合损失函数
编码器模块
终端设备
解码
通道
图像处理技术
数据获取模块
处理器
数据标签
计算机视觉
系统为您推荐了相关专利信息
修复方法
时空卷积神经网络
孤立森林算法
农业数据处理技术
生成对抗网络
二维码
深度学习网络
多尺度特征
图像重建
特征融合网络
负荷预测方法
融合注意力机制
分段
残差网络
粒子群优化算法
交叉注意力机制
特征提取网络
依赖特征
跨模态数据
变量