摘要
本发明公开了一种基于多模态图像特征融合的地面目标识别方法及系统,具体为:首先获得地面目标的红外图像、可见光图像、SAR图像,对三种模态的图像进行图像扩增,并添加分类标签;然后采用不同的神经网络模型进行网络训练,实现目标的初步分类;接着对预训练的三个神经网络模型去掉分类头,固定特征提取网络参数,使用预训练的特征提取模块提取不同模态数据的特征,并使用通道‑空间‑模态三级注意力融合模块进行特征融合;再使用多模态图像与标签重新进行神经网络模型训练,得到训练完成的神经网络模型;最后将待识别的图像输入到训练好的神经网络模型中进行目标识别。本发明提高了复杂环境下的地面目标识别的精度,计算开销低,适应性强,扩展性强。
技术关键词
多模态
识别方法
神经网络模型训练
可见光图像
特征提取网络
多尺度特征金字塔
注意力
模态特征
地面
特征提取模块
标签
通道
上下文特征
跨模态
直方图均衡化
系统为您推荐了相关专利信息
特征提取网络
声音事件检测方法
事件检测模型
多尺度
注意力
情绪识别模型
情绪识别方法
策略
参数
置信度阈值
人脸活体检测模型
人脸活体检测方法
检测人脸图像
图像特征向量
焦点损失函数