摘要
本申请实施例提供多模态图像融合决策方法、装置、设备和存储介质,涉及图像处理技术领域。根据当前帧对应的RGB图像和DVS图像得到RGB编码特征和DVS编码特征,获取当前帧对应的时空掩码矩阵,将RGB编码特征、DVS编码特征和时空掩码矩阵输入预设层数互相级联的注意力融合结构进行特征融合得到RGB融合特征和DVS融合特征,获取基于RGB融合特征和DVS融合特征进行信息交互得到的交互特征,利用解码器根据RGB融合特征、DVS融合特征和交互特征得到当前帧的预测结果。针对黑暗场景下RGB图像易受光照不足影响产生的噪声、DVS图像因动态信息捕捉偏差出现的干扰,引入时空掩码矩阵进行抑制,降低噪声的影响,并通过交互特征补充场景动态信息,提升黑暗场景下的预测精度。
技术关键词
融合决策方法
掩码矩阵
融合特征
编码特征
交互特征
注意力
分块
数据
输入解码器
内存结构
多模态
级联
图像处理技术
编码器
解码模块
电子设备
编码模块
处理器
系统为您推荐了相关专利信息
全自动视觉印刷机
轮廓特征
锡膏量
点焊头
融合特征
遥感图像融合方法
图像特征提取
边缘轮廓
多尺度
序列
编码特征
序列编码方法
数据更新频率
样本
机器学习模型
汉字
分层随机抽样
样本
匹配网络
卷积神经网络训练