摘要
本发明提供了一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法,属于计算机视觉、换装行人重识别和深度学习领域。方法包括以下几个模块:图像文本提取模块,图像文本对齐模块,特征分解解耦模块和服装依赖消除模块。与现有技术相比,本发明针对换装行人重识别设计了特征分解解耦方法和服装依赖消除方法,通过特征分解的方法,使行人图像中的服装相关部分特征和服装无关特征有效地解耦分离,并保证其健壮性,也就是说,在使二者相对独立的同时保证其包含原始图像中与其相关的全部特征。与此同时,其分解出来的子特征也能与前面提取到的文本进行对比对齐,保证其在文本维度上也与原始特征对齐。此外,通过提取原始行人特征和其中服装特征之间的交叉特征,并且以交叉特征不影响模型的梯度来降低特征对模型的影响。在模型训练的过程中能够在使所需特征和不需要的特征解耦分离的同时保证其子特征的健壮性,并在模型训练过程中,杜绝模型对不需要特征产生依赖。以此使模型能获得识别的最佳效果。
技术关键词
特征学习模型
重识别方法
文本
服装
行人重识别
场景
图像编码器
解耦方法
行人特征
消除方法
对齐模块
计算机视觉
特征选择
分支
矩阵
高性能
身份
图片
系统为您推荐了相关专利信息
CRF模型
条件随机场
联合损失函数
文本
命名实体识别系统
提醒方法
节约搜索时间
Android系统
优化用户体验
文本
专业知识库
答案
生成方法
文本段落
关键词搜索算法
场景理解方法
三维点云数据
特征提取模块
多模态
实例分割