摘要
本发明提出了一种基于可扩展表征学习的行人重识别方法。主要包括视觉表征学习模块、文本表征学习模块和行人检索模块。视觉表征学习模块利用来自两个空间的ViT结构的视觉编码特征增强图像区分能力,并通过因果注意力机制融合;文本表征学习模块借助示范样本,同时采用因果注意力机制,消除数据集中存在的偏差,从而提高行人重识别的性能,使行人检索结果更加准确。
技术关键词
重识别方法
视觉表征学习
特征提取器
注意力机制
图像特征提取
文本编码器
图像编码器
行人重识别模型
融合策略
视觉特征
样本
跨模态
模块
语义
索引
系统为您推荐了相关专利信息
功率分配模型
功率分配策略
协同通信方法
模型更新
车辆对车辆通信
关键点
视觉检测方法
检测网络模型
原电池
图像采集模块