一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法

AITNT
正文
推荐专利
一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法
申请号:CN202510207870
申请日期:2025-02-25
公开号:CN120047973A
公开日期:2025-05-27
类型:发明专利
摘要
本发明提供了一种基于CLIP大模型的特征学习模型及监控场景下换装行人重识别方法,属于计算机视觉、换装行人重识别和深度学习领域。方法包括以下几个模块:图像文本提取模块,图像文本对齐模块,特征分解解耦模块和服装依赖消除模块。与现有技术相比,本发明针对换装行人重识别设计了特征分解解耦方法和服装依赖消除方法,通过特征分解的方法,使行人图像中的服装相关部分特征和服装无关特征有效地解耦分离,并保证其健壮性,也就是说,在使二者相对独立的同时保证其包含原始图像中与其相关的全部特征。与此同时,其分解出来的子特征也能与前面提取到的文本进行对比对齐,保证其在文本维度上也与原始特征对齐。此外,通过提取原始行人特征和其中服装特征之间的交叉特征,并且以交叉特征不影响模型的梯度来降低特征对模型的影响。在模型训练的过程中能够在使所需特征和不需要的特征解耦分离的同时保证其子特征的健壮性,并在模型训练过程中,杜绝模型对不需要特征产生依赖。以此使模型能获得识别的最佳效果。
技术关键词
特征学习模型 重识别方法 文本 服装 行人重识别 场景 图像编码器 解耦方法 行人特征 消除方法 对齐模块 计算机视觉 特征选择 分支 矩阵 高性能 身份 图片
系统为您推荐了相关专利信息
1
一种基于多语料聚合和大模型语料扩充的生物医学命名实体识别方法
CRF模型 条件随机场 联合损失函数 文本 命名实体识别系统
2
一种面向RAG的文档解析方法、系统及计算机设备
文档解析方法 文本 关系型数据库 格式 语义结构
3
一种ANDROID智能终端敏感词提醒方法、系统、设备及存储介质
提醒方法 节约搜索时间 Android系统 优化用户体验 文本
4
一种提升大模型回答应急知识问题准确性的生成方法
专业知识库 答案 生成方法 文本段落 关键词搜索算法
5
基于统一多模态的开放词汇三维场景理解方法
场景理解方法 三维点云数据 特征提取模块 多模态 实例分割
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号