摘要
本发明涉及计算机视觉与跨视角行人识别技术领域,特别是涉及一种基于视觉语言提示学习的跨视角行人再识别方法,包括:获取目标图像;将所述目标图像输入预设的行人识别模型中,输出行人再识别结果,其中,所述行人识别模型通过采用提示学习机制和双阶段训练策略训练视觉语言预训练模型CLIP得到,其中,所述提示学习机制用于建模视角偏差,所述双阶段训练策略用于实现跨模态语义对齐。本发明能够显著提升跨视角识别的准确性与鲁棒性。
技术关键词
行人再识别方法
文本
样本
视觉
阶段
地面视角图像
预训练模型
行人识别技术
跨模态
身份
代表性图像
语义
三元组
图像编码器
系统为您推荐了相关专利信息
自动泊车方法
地点
车辆
自动泊车装置
训练图像数据
仿真模型
配网
计算机可执行指令
邻居
神经网络模型
辅助采血设备
采血试管
夹持组件
试管台
采血针组件
视觉特征
医学知识图谱
健康数据分析方法
长短期记忆网络
线性回归模型
平衡控制方法
融合算法
障碍物识别
协作策略
环境状态信息