摘要
本发明公开了一种基于噪声学习的文本图像宠物重识别方法,包括以下步骤:收集宠物图像与描述文本对数据,并进行规范化处理;对图像与描述文本数据集分别进行向量化;对图文数据集进行全局和局部相似度计算;跨模态检索模型训练;模型推理与检索。本发明通过高斯混合模型和共识划分策略,利用对损失函数进行平滑优化、增强对噪声数据的鲁棒性、支持细粒度特征学习及对正样本的关注,有效过滤噪声数据并校准标签,提升了跨模态任务中对噪声数据的鲁棒性和匹配精度,提供了更高的灵活性和理论保证;同时通过跨模态特征提取和噪声鲁棒性设计,能够处理不同光照、背景和姿态下的宠物图像,提升实际应用中的泛化能力。
技术关键词
重识别方法
图像
噪声集
表达式
样本
高斯混合模型
细粒度特征学习
噪声数据
图文
跨模态
后验概率
噪声鲁棒性
标签
更新模型参数
注意力
文本编码器
校准