基于双流Transformer框架的图像文本行人重识别方法及系统

正文

推荐专利

申请号：CN202410911258

申请日期：2024-07-09

公开号：CN118865442A

公开日期：2024-10-29

类型：发明专利

摘要

本发明属于行人重识别领域，涉及基于双流Transformer框架的图像文本行人重识别方法。该方法包括以下步骤：S1)对数据集进行预处理包括图像数据增强以及文本随机掩码；S2)对预处理后图像文本数据分别输入到双流Transformer网络中进行特征提取；S3)对于掩码文本特征向量，与图像向量间进行跨模态交互编码；S4)对于未掩码的文本特征向量，将其与图像向量进行特征共享学习；S5)对上述步骤训练的模型，在测试数据集上进行实验，得到最终结果。本发明提出一种结合双流Transformer模型，充分提取文本辅助信息和图像信息的全局特征和细粒度特征，然后融合文本信息和图像信息分别进行注意力的交互以及特征共享学习，最后通过合适的损失函数的计算，从而实现高性能的行人重识别方法。

技术关键词

重识别方法文本特征向量编码器跨模态数据增广方法图像块框架标记网络多模态交互细粒度特征全局平均池化注意力行人重识别图像特征提取视觉标志

系统为您推荐了相关专利信息

基于可学习语义先验的低照度图像增强方法

语义先验图像增强方法可见光图像学习器照度

一种基于双路径多尺度注意力与边界感知的遥感图像分割方法

遥感图像分割方法神经网络架构多尺度注意力语义特征提取

一种基于皮肤肤质的护肤推荐方法

护肤产品多模态传感器推荐方法多层次特征提取深度卷积神经网络

一种基于大模型的视频检索与片段定位方法及系统

知识点文本定位方法视频生成字幕

一种基于AI的文化和旅游图片文字描述生成方法及系统

图片生成方法生成向量训练样本集输入神经网络模型

基于双流Transformer框架的图像文本行人重识别方法及系统

站点导航

APP 下载