一种基于视觉语言提示学习的跨视角行人再识别方法

正文

推荐专利

申请号：CN202511046002

申请日期：2025-07-29

公开号：CN120976969A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及计算机视觉与跨视角行人识别技术领域，特别是涉及一种基于视觉语言提示学习的跨视角行人再识别方法，包括：获取目标图像；将所述目标图像输入预设的行人识别模型中，输出行人再识别结果，其中，所述行人识别模型通过采用提示学习机制和双阶段训练策略训练视觉语言预训练模型CLIP得到，其中，所述提示学习机制用于建模视角偏差，所述双阶段训练策略用于实现跨模态语义对齐。本发明能够显著提升跨视角识别的准确性与鲁棒性。

技术关键词

行人再识别方法文本样本视觉阶段地面视角图像预训练模型行人识别技术跨模态身份代表性图像语义三元组图像编码器

系统为您推荐了相关专利信息

自动泊车方法、装置、设备及存储介质

自动泊车方法地点车辆自动泊车装置训练图像数据

一种配网仿真模型的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品

仿真模型配网计算机可执行指令邻居神经网络模型

一种辅助采血设备及其操作方法

辅助采血设备采血试管夹持组件试管台采血针组件

一种消化道健康数据分析方法及系统

视觉特征医学知识图谱健康数据分析方法长短期记忆网络线性回归模型

一种基于内嵌深度融合算法的机器人稳定与平衡控制方法

平衡控制方法融合算法障碍物识别协作策略环境状态信息

一种基于视觉语言提示学习的跨视角行人再识别方法

站点导航

APP 下载