一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法

正文

推荐专利

申请号：CN202510207870

申请日期：2025-02-25

公开号：CN120047973A

公开日期：2025-05-27

类型：发明专利

摘要

本发明提供了一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法，属于计算机视觉、换装行人重识别和深度学习领域。方法包括以下几个模块：图像文本提取模块，图像文本对齐模块，特征分解解耦模块和服装依赖消除模块。与现有技术相比，本发明针对换装行人重识别设计了特征分解解耦方法和服装依赖消除方法，通过特征分解的方法，使行人图像中的服装相关部分特征和服装无关特征有效地解耦分离，并保证其健壮性，也就是说，在使二者相对独立的同时保证其包含原始图像中与其相关的全部特征。与此同时，其分解出来的子特征也能与前面提取到的文本进行对比对齐，保证其在文本维度上也与原始特征对齐。此外，通过提取原始行人特征和其中服装特征之间的交叉特征，并且以交叉特征不影响模型的梯度来降低特征对模型的影响。在模型训练的过程中能够在使所需特征和不需要的特征解耦分离的同时保证其子特征的健壮性，并在模型训练过程中，杜绝模型对不需要特征产生依赖。以此使模型能获得识别的最佳效果。

技术关键词

特征学习模型重识别方法文本服装行人重识别场景图像编码器解耦方法行人特征消除方法对齐模块计算机视觉特征选择分支矩阵高性能身份图片

系统为您推荐了相关专利信息

一种基于多语料聚合和大模型语料扩充的生物医学命名实体识别方法

CRF模型条件随机场联合损失函数文本命名实体识别系统

一种面向RAG的文档解析方法、系统及计算机设备

文档解析方法文本关系型数据库格式语义结构

一种ANDROID智能终端敏感词提醒方法、系统、设备及存储介质

提醒方法节约搜索时间 Android系统优化用户体验文本

一种提升大模型回答应急知识问题准确性的生成方法

专业知识库答案生成方法文本段落关键词搜索算法

基于统一多模态的开放词汇三维场景理解方法

场景理解方法三维点云数据特征提取模块多模态实例分割

一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法

站点导航

APP 下载