基于视觉语言预训练模型的换装行人重识别方法及系统

正文

推荐专利

申请号：CN202511053143

申请日期：2025-07-30

公开号：CN120580647A

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及计算机视觉技术领域，具体涉及基于视觉语言预训练模型的换装行人重识别方法。所述方法包括：训练阶段：输入图像获取衣物掩膜图，生成衣物无关/相关提示。固定文本编码器参数并优化提示权重将文本提示输入编码器获特征，构建分类器以交叉熵损失实现图像‑文本对齐；用视觉编码器提取掩膜图特征，约束类中心欧氏距离实现图像－图像对齐；剥离衣物特征：提取衣物区域特征与对应文本特征，经分类器优化后引入正交损失解耦衣物相关性；推理阶段：将查询图像输入训练好的图像编码器提取特征，与图库特征计算余弦相似度排序返回结果。本技术方案能够提高行人重识别方法在行人服饰变化条件下识别准确率。

技术关键词

重识别方法预训练模型行人特征文本编码器行人重识别系统图像编码器服饰特征身份文本分类器衣物图像视觉特征计算机视觉技术构建分类器衣服

系统为您推荐了相关专利信息

一种基于大模型的交通问答方法、装置及设备

结构编码器三元组问答模型文本编码器指令

一种基于动态top-k选择专家模型的文本常识推理方法

数据集构建方法动态依存句法分析自然语言文本模型训练方法

基于多模态大语言模型的宫颈癌智能筛查方法

筛查方法大语言模型阴道镜多模态预训练模型

一种基于可解释视觉提示的人物交互行为识别方法和装置

视觉特征物体检测器姿态特征识别方法特征提取网络

面向无人机网络语义通信的分层联邦蒸馏学习方法和装置

蒸馏学习方法面向无人机客户端语义分层

基于视觉语言预训练模型的换装行人重识别方法及系统

站点导航

APP 下载