摘要
本发明涉及计算机视觉技术领域,具体涉及基于视觉语言预训练模型的换装行人重识别方法。所述方法包括:训练阶段:输入图像获取衣物掩膜图,生成衣物无关/相关提示。固定文本编码器参数并优化提示权重将文本提示输入编码器获特征,构建分类器以交叉熵损失实现图像‑文本对齐;用视觉编码器提取掩膜图特征,约束类中心欧氏距离实现图像-图像对齐;剥离衣物特征:提取衣物区域特征与对应文本特征,经分类器优化后引入正交损失解耦衣物相关性;推理阶段:将查询图像输入训练好的图像编码器提取特征,与图库特征计算余弦相似度排序返回结果。本技术方案能够提高行人重识别方法在行人服饰变化条件下识别准确率。
技术关键词
重识别方法
预训练模型
行人特征
文本编码器
行人重识别系统
图像编码器
服饰特征
身份
文本分类器
衣物图像
视觉特征
计算机视觉技术
构建分类器
衣服
系统为您推荐了相关专利信息
数据集构建方法
动态
依存句法分析
自然语言文本
模型训练方法
视觉特征
物体检测器
姿态特征
识别方法
特征提取网络