摘要
本发明公开了一种基于抗噪对比损失的多模态目标识别方法,包括以下步骤:S1、根据输入的多模态目标信息,对各模态选取不同的编码器架构和解码器架构分别作为特征提取网络和重构网络;S2、根据输入的多模态目标类别数量,构建多模态目标识别网络;S3、根据抗噪对比损失和模态重构损失进行训练,并更新特征提取网络、重构网络以及识别网络;S4、将待识别目标各模态数据输入特征提取网络,融合后再输入识别网络,最终得到和类别数相同的维度向量,并选取概率值最大的类别作为待识别目标预测类别;本发明解决了含噪场景下传统基于交叉熵的多模态目标识别方法中识别准确率较低的问题,缓解了由于标签噪声引起的过拟合现象。
技术关键词
特征提取网络
识别方法
编码器架构
解码器架构
模态特征
融合特征
样本
预测类别
多模态
噪声标签
鲁棒性
重构误差
编码向量
预测误差
数据