基于视觉语言预训练模型的换装行人重识别方法及系统

AITNT
正文
推荐专利
基于视觉语言预训练模型的换装行人重识别方法及系统
申请号:CN202511053143
申请日期:2025-07-30
公开号:CN120580647A
公开日期:2025-09-02
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,具体涉及基于视觉语言预训练模型的换装行人重识别方法。所述方法包括:训练阶段:输入图像获取衣物掩膜图,生成衣物无关/相关提示。固定文本编码器参数并优化提示权重将文本提示输入编码器获特征,构建分类器以交叉熵损失实现图像‑文本对齐;用视觉编码器提取掩膜图特征,约束类中心欧氏距离实现图像-图像对齐;剥离衣物特征:提取衣物区域特征与对应文本特征,经分类器优化后引入正交损失解耦衣物相关性;推理阶段:将查询图像输入训练好的图像编码器提取特征,与图库特征计算余弦相似度排序返回结果。本技术方案能够提高行人重识别方法在行人服饰变化条件下识别准确率。
技术关键词
重识别方法 预训练模型 行人特征 文本编码器 行人重识别系统 图像编码器 服饰特征 身份 文本分类器 衣物图像 视觉特征 计算机视觉技术 构建分类器 衣服
系统为您推荐了相关专利信息
1
一种基于大模型的交通问答方法、装置及设备
结构编码器 三元组 问答模型 文本编码器 指令
2
一种基于动态top-k选择专家模型的文本常识推理方法
数据集构建方法 动态 依存句法分析 自然语言文本 模型训练方法
3
基于多模态大语言模型的宫颈癌智能筛查方法
筛查方法 大语言模型 阴道镜 多模态 预训练模型
4
一种基于可解释视觉提示的人物交互行为识别方法和装置
视觉特征 物体检测器 姿态特征 识别方法 特征提取网络
5
面向无人机网络语义通信的分层联邦蒸馏学习方法和装置
蒸馏学习方法 面向无人机 客户端 语义 分层
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号