摘要
本发明公开了基于多尺度交叉注意力Transformer的跨模态行人重识别方法,包括以下步骤:步骤一、图像获取,步骤二、特征集获取,步骤三、特征融合,步骤四、特征确定,本发明网络的初始阶段,使用两个标准数据集以获取RGB和红外图像,接着,利用MSCAViT从RGB和红外图像中提取关键特征,得到两个特征集,然后,将RGB图像转换为灰度图像,并输入MSCAViT模型以获得第三个特征集,通过这三个特征集的加权融合,使用OSCSO方法确定最优权重,最终得到融合特征,将结果特征输入MSCAViT的解码端,生成最终用于图像匹配的特征,模型通过多种指标进行评估,并与传统方法进行比较,结果表明,所提出的方法在解决VI Re‑ID任务中的模态差异问题上表现出更优越的效果。
技术关键词
重识别方法
多尺度
前馈神经网络
令牌
编码器
融合特征
分支
行人重识别
图像匹配
位置更新
身份
跨模态
可见光
红外图像特征
交叉注意力机制
图像块特征
系统为您推荐了相关专利信息
图像编码器
预训练模型
多模态
图像嵌入
文本编码器
细粒度特征
情绪识别方法
网络解码
解码模型
情绪识别系统
农作物遥感分类方法
多尺度特征提取
图像
可见光
标签