基于双流Transformer框架的图像文本行人重识别方法及系统

AITNT
正文
推荐专利
基于双流Transformer框架的图像文本行人重识别方法及系统
申请号:CN202410911258
申请日期:2024-07-09
公开号:CN118865442A
公开日期:2024-10-29
类型:发明专利
摘要
本发明属于行人重识别领域,涉及基于双流Transformer框架的图像文本行人重识别方法。该方法包括以下步骤:S1)对数据集进行预处理包括图像数据增强以及文本随机掩码;S2)对预处理后图像文本数据分别输入到双流Transformer网络中进行特征提取;S3)对于掩码文本特征向量,与图像向量间进行跨模态交互编码;S4)对于未掩码的文本特征向量,将其与图像向量进行特征共享学习;S5)对上述步骤训练的模型,在测试数据集上进行实验,得到最终结果。本发明提出一种结合双流Transformer模型,充分提取文本辅助信息和图像信息的全局特征和细粒度特征,然后融合文本信息和图像信息分别进行注意力的交互以及特征共享学习,最后通过合适的损失函数的计算,从而实现高性能的行人重识别方法。
技术关键词
重识别方法 文本特征向量 编码器 跨模态 数据增广方法 图像块 框架 标记 网络 多模态交互 细粒度特征 全局平均池化 注意力 行人重识别 图像特征提取 视觉 标志
系统为您推荐了相关专利信息
1
基于可学习语义先验的低照度图像增强方法
语义先验 图像增强方法 可见光图像 学习器 照度
2
一种基于双路径多尺度注意力与边界感知的遥感图像分割方法
遥感图像分割方法 神经网络架构 多尺度 注意力 语义特征提取
3
一种基于皮肤肤质的护肤推荐方法
护肤产品 多模态传感器 推荐方法 多层次特征提取 深度卷积神经网络
4
一种基于大模型的视频检索与片段定位方法及系统
知识点 文本 定位方法 视频 生成字幕
5
一种基于AI的文化和旅游图片文字描述生成方法及系统
图片 生成方法 生成向量 训练样本集 输入神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号