摘要
本发明涉及计算机视觉技术领域,具体涉及一种行人重识别方法,包括下列步骤:S1:收集行人重识别数据;S2:根据行人重识别数据构建场景图;S3:构建图文多模态模型架构,包括域自适应模块和任务自适应模块;S4:基于提示学习和场景图知识,对图文多模态模型架构进行训练,得到图文对齐模型;S5:将场景图和文本输入所述图文对齐模型,输出结构知识嵌入;S6:将结构知识嵌入结合原始的文本,得到融合特征;S7:采用融合特征实现行人重识别预测。本发明使用提示学习实现下游数据域与CLIP模型原始训练数据域的对齐,进一步引入语义负采样和场景图解析器,使用场景图知识作为输入,增强模型对结构化知识的获取能力。
技术关键词
重识别方法
行人重识别数据
文本编码器
图文
融合特征
场景
多模态
收集行人
解析器
三元组
图像
计算机视觉技术
模块
可读存储介质
样本
处理器
表达式
实体
系统为您推荐了相关专利信息
图像生成方法
矩阵
像素
文本编码器
图像生成装置
图案
缺陷分类方法
图像处理网络
轮廓
缺陷分类装置
文本生成图像方法
生成对抗网络
编码器模块
文本编码器
采样模块
人机交互智能
模态特征
高精度模具
精密模具
意图