一种基于视觉语言模型的车辆重识别域自适应方法

正文

推荐专利

申请号：CN202411603509

申请日期：2024-11-12

公开号：CN119580172A

公开日期：2025-03-07

类型：发明专利

摘要

本发明公开一种基于视觉语言模型的车辆重识别域自适应方法，图像处理、机器学习领域。解决现有技术缺乏获取语义信息手段、重识别准确率低的问题。充分利用了视觉文本模型的视觉文本表示能力，通过为每个个体分配一组可学习的文本标记来利用视觉语言模型的跨模态描述能力。这些标记被馈送到文本编码器以生成提示，从而增强图像编码器对目标域的特征提取。在约束提示学习步骤中，图像和文本编码器是固定的，只有文本提示在进行优化。在联合图像编码器优化阶段，联合使用源域和目标域数据，文本提示和文本编码器是固定的，为微调图像编码器提供约束。本发明在车辆重新识别域自适应任务中增强了模型的特征提取能力，提升了匹配准确率。

技术关键词

车辆重识别图像编码器文本编码器视觉参数数据特征提取能力标签标记样本聚类图像处理语义三元组身份关键词

一种基于视觉语言模型的车辆重识别域自适应方法

站点导航

APP 下载