摘要
本发明公开了一种基于文本引导的服装可泛化行人重识别方法,在文本域中,将服装信息和服装不变特征通过独立的短语进行描述,避免了它们在视觉上的强耦合,通过这种方式,本发明能够从行人图像中提取出纯粹的服装不变特征,并利用这些特征指导视觉模型进行服装无关的行人重识别。本发明通过文本域解耦服装相关特征与服装无关特征,解决了传统方法因服装变化导致的特征混淆问题。
技术关键词
服装
重识别方法
文本编码器
行人重识别
计算机存储介质
存储计算机程序
大语言模型
计算机程序产品
图像匹配
处理器
图像编码器
多模态
行人特征
生成模板
存储器
视觉特征
注意力机制
电子设备
系统为您推荐了相关专利信息
可见光图像
图像融合方法
多模态特征
融合特征
红外图像特征
报告自动生成方法
文本生成器
上下文特征
患者
文本编码器
重识别方法
图像编码器
行人重识别数据
身份
文本编码器
涂装车间
喷涂工艺
数字孪生模型
监控平台
喷涂机器人