摘要
本发明公开了基于多尺度交叉注意力Transformer的跨模态行人重识别方法,包括以下步骤:步骤一、图像获取,步骤二、特征集获取,步骤三、特征融合,步骤四、特征确定,本发明网络的初始阶段,使用两个标准数据集以获取RGB和红外图像,接着,利用MSCAViT从RGB和红外图像中提取关键特征,得到两个特征集,然后,将RGB图像转换为灰度图像,并输入MSCAViT模型以获得第三个特征集,通过这三个特征集的加权融合,使用OSCSO方法确定最优权重,最终得到融合特征,将结果特征输入MSCAViT的解码端,生成最终用于图像匹配的特征,模型通过多种指标进行评估,并与传统方法进行比较,结果表明,所提出的方法在解决VI Re‑ID任务中的模态差异问题上表现出更优越的效果。
技术关键词
重识别方法
多尺度
前馈神经网络
令牌
编码器
融合特征
分支
行人重识别
图像匹配
位置更新
身份
跨模态
可见光
红外图像特征
交叉注意力机制
图像块特征
系统为您推荐了相关专利信息
人脸活体检测方法
活体检测模块
编码器
语义特征
前馈神经网络
燃料组件
特征检测方法
表面图像数据
表面特征检测装置
融合图像特征