基于多尺度交叉注意力Transformer的跨模态行人重识别方法

正文

推荐专利

申请号：CN202411604497

申请日期：2024-11-12

公开号：CN119649399A

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了基于多尺度交叉注意力Transformer的跨模态行人重识别方法，包括以下步骤：步骤一、图像获取，步骤二、特征集获取，步骤三、特征融合，步骤四、特征确定，本发明网络的初始阶段，使用两个标准数据集以获取RGB和红外图像，接着，利用MSCAViT从RGB和红外图像中提取关键特征，得到两个特征集，然后，将RGB图像转换为灰度图像，并输入MSCAViT模型以获得第三个特征集，通过这三个特征集的加权融合，使用OSCSO方法确定最优权重，最终得到融合特征，将结果特征输入MSCAViT的解码端，生成最终用于图像匹配的特征，模型通过多种指标进行评估，并与传统方法进行比较，结果表明，所提出的方法在解决VI Re‑ID任务中的模态差异问题上表现出更优越的效果。

技术关键词

重识别方法多尺度前馈神经网络令牌编码器融合特征分支行人重识别图像匹配位置更新身份跨模态可见光红外图像特征交叉注意力机制图像块特征

系统为您推荐了相关专利信息

一种红外目标检测方法、装置、设备及介质

编码特征编码器模块注意力强化特征像素点

一种面向多模态预训练模型的模型逆向方法、系统、装置及设备

图像编码器预训练模型多模态图像嵌入文本编码器

一种基于LLM的复杂语言问句的SQL查询生成方法及系统

查询生成方法语义向量核心语句脚本

基于多尺度脑网络解码模型的情绪识别方法、系统及终端

细粒度特征情绪识别方法网络解码解码模型情绪识别系统

一种融合动态光谱优化与多尺度特征强化的农作物遥感分类方法

农作物遥感分类方法多尺度特征提取图像可见光标签

基于多尺度交叉注意力Transformer的跨模态行人重识别方法

站点导航

APP 下载