摘要
本发明涉及重识别模型处理领域,公开了一种基于多模态协同学习框架的重识别模型训练方法及系统,包括:基于预训练好的CLIP模型分别生成可见光文本语义信息和红外光文本语义信息;基于输入可见‑红外行人重识别模型的样本进行动态对比学习得到动态对比损失函数;计算可见光图像文本对比损失,计算红外光图像文本对比损失,根据可见光图像文本对比损失和红外光图像文本对比损失构建图像到文本的对比损失函数,并利用动态对比损失函数和图像到文本的对比损失函数对可见‑红外行人重识别模型进行训练;本发明解决了现有的可见‑红外行人重识别训练存在无法充分捕捉样本之间的语义关系、容易受噪声影响的问题。
技术关键词
可见光图像
红外光
识别模型训练方法
行人重识别模型
语义
多模态协同
文本编码器
标签
高斯核函数
框架
动态
样本
DBSCAN算法
编码向量
聚类
身份
系统为您推荐了相关专利信息
发送方法
计算机程序产品
电子设备
可读存储介质
视觉特征