摘要
本发明公开一种基于视觉语言模型的车辆重识别域自适应方法,图像处理、机器学习领域。解决现有技术缺乏获取语义信息手段、重识别准确率低的问题。充分利用了视觉文本模型的视觉文本表示能力,通过为每个个体分配一组可学习的文本标记来利用视觉语言模型的跨模态描述能力。这些标记被馈送到文本编码器以生成提示,从而增强图像编码器对目标域的特征提取。在约束提示学习步骤中,图像和文本编码器是固定的,只有文本提示在进行优化。在联合图像编码器优化阶段,联合使用源域和目标域数据,文本提示和文本编码器是固定的,为微调图像编码器提供约束。本发明在车辆重新识别域自适应任务中增强了模型的特征提取能力,提升了匹配准确率。
技术关键词
车辆重识别
图像编码器
文本编码器
视觉
参数
数据
特征提取能力
标签
标记
样本
聚类
图像处理
语义
三元组
身份
关键词