一种基于视觉语言大模型的零训练车辆重识别方法

正文

推荐专利

申请号：CN202510185338

申请日期：2025-02-19

公开号：CN120220085B

公开日期：2025-12-05

类型：发明专利

摘要

本发明涉及计算机视觉与智能交通领域，提供一种基于视觉语言大模型的零训练车辆重识别方法，包括：动态多粒度文本生成，利用视觉语言大模型对车辆进行视觉特征分析生成结构化层次描述，通过构建层次化生成框架，分层生成车型、颜色、视角的基础语义标签和局部语义引导的关键细节区域描述，并根据置信度的动态调整描述层级；自适应特征融合，实现视觉‑文本特征的自适应融合用于车辆相似度粗排序；组合式对比推理，将视觉‑文本粗排序列表的TopN图像划分为N/2个对比组，利用视觉语言大模型进行多图像联合分析实现精排序。本发明方法生成了车辆图像的多层级细粒度文本描述，在无需训练的情况下实现了开放场景下的车辆重识别。

技术关键词

重识别方法文本生成框架视觉特征层级语义标签列表车辆重识别特征检测器视角组合式车型稳态概率置信度阈值动态图像缩放

系统为您推荐了相关专利信息

一种基于大语言模型的通用个性化生成方法

个性化生成方法大语言模型文本风格生成程序

文档转换方法、装置、电子设备及存储介质

文档转换方法便携式文档格式超文本标记语言网络数据

一种基于上下文信息增强的短视频智能理解方法

短视频视频帧融合特征关键帧自动语音识别

基于北斗网格码的变电站智能巡检机器人路径规划方法

路段网格变电站建立关联关系巡检路径规划

图像推理多模态神经网络的云边端协同部署方法及系统

多模态终端设备语义功能服务器跨模态

一种基于视觉语言大模型的零训练车辆重识别方法

站点导航

APP 下载