摘要
本发明涉及行人重识别领域,公开了一种无监督文本到图像的行人重识别方法及系统,包括:构建无监督数据集;对图像进行区域划分,将各图像区域和文本分别编码,为每个图像区域选择余弦相似度高的文本合并作为新的文本,得到新的数据集;采用新的数据集训练ReID模型;基于预训练的ReID模型进行反向检索,得到筛选后的数据集;采用筛选后的数据集训练ReID模型,得到训练后的ReID模型;将待识别文本输入训练后的ReID模型中得到Top‑k相似的图像。本发明避免了对大型语言模型的依赖,检索文本能够聚焦于不同的身体区域,形成更精准和全面的描述,并通过反向检索减少了文本的噪声和冗余,提高了文本与图像匹配的准确性。
技术关键词
重识别方法
无监督
数据
模型训练模块
行人重识别系统
令牌
文本编码器
图像块
视觉特征
图像匹配
索引
序列
跨模态
识别模块
列表
训练集
系统为您推荐了相关专利信息
海洋环境信息
轨迹修正方法
误差分析方法
运动误差补偿
测量误差
多尺度形态学
母乳
模糊推理系统
分形动力学
模糊神经网络
寿命预测方法
寿命预测模型
整车控制单元
电机
抗氧化剂