摘要
本发明公开了一种针对噪声关联的文本‑图像行人重识别方法。该方法包括:分别对图像与文本进行全局特征表示以及局部特征表示,并进行全局特征标记与局部特征标记;采用动态特定于实例的选择与校正方法,对图像与文本数据进行划分;构建多粒度全局特征学习模块,将图像与文本的局部特征输入多粒度全局特征学习模块,得到多粒度的全局特征;通过ID分类损失与相似度分布匹配损失训练优化网络模型,对身份ID进行损失的计算,对多粒度全局特征完成相似度分布匹配损失的计算。通过本发明的技术方案,有效提高基于文本描述的行人重识别的匹配精度。
技术关键词
文本
标记
图像行人
重识别方法
噪声数据
校正方法
身份
序列
行人重识别
图像编码器
图像块
网络
模块
图像分割
异常数据
动态
广义
系统为您推荐了相关专利信息
三维人体动作
运动特征
交叉注意力机制
动作特征
生成方法
多尺度特征融合
识别医学图像
视觉问答方法
问答模型
文本
图像生成模型
图像生成方法
图像生成程序
计算机程序产品
图像生成设备