摘要
本发明提出一种基于二分混合的视觉语言红外行人重识别网络模型的方法,该方法包括:将可见光图像和红外图像输入至二分分离器中进行二分操作,生成二分混合图像;对可见光图像和红外图像利用图像编码器进行图像编码,生成图像特征;对可见光图像、红外图像和二分混合图像通过文本生成模块和文本编码器进行编码,生成文本特征;本发明提出的二分混合辅助方法,能够深入分析可见光与红外图像之间的差异,通过特定的混合策略,有效弥补可见与红外的文本预测差异,从而在复杂的红外图像场景中更好地识别行人,提升了红外行人重识别的准确率。
技术关键词
集成特征
行人重识别网络
可见光图像
红外图像特征
生成图像特征
图像编码器
注意力
混合模块
文本编码器
三元组
视觉
语义
分离器
图文
行人重识别模型
混合器