摘要
本发明属于跨模态行人重识别领域,公开了一种基于煤矿场景的跨模态行人重识别方法,该方法包括:步骤1、获取表示行人图像的身份及行人图像对应的身份标签,并进行预处理;步骤2、构建跨模态行人重识别主干网络;步骤3、构建多尺度特征增强模块并加入跨模态行人重识别主干网络中;步骤4、确定损失函数,完成跨模态行人重识别主干网络的最终训练;步骤5、将其中一个模态行人图像作为查询集,另一模态行人图像作为待检索集,将查询集中的行人图像与待检索集中的行人图像进行匹配,得到跨模态行人重识别结果。本发明可有效融合跨模态间的图像特征和有效挖掘行人图像的特征信息,有效提升了模型在跨模态行人图像检索场景下的预测能力和泛化能力。
技术关键词
行人重识别
可见光图像
重识别方法
跨模态
交叉注意力机制
关系建模
红外光
编码器
三元组损失函数
语义
离散余弦变换
多尺度特征
预训练模型
样本
场景
文本
系统为您推荐了相关专利信息
跨模态
对齐方法
交叉注意力机制
条件随机场
文本编码器
无人机飞行路径
三维语义地图
运动轨迹预测
标识
对象
语义分割方法
语义分割模型
抑制背景噪声
种子
掩模
故障预警方法
运维
神经网络训练
记忆
动态权重分配
智能决策系统
智能决策方法
多模态
数据采集模块
数据分析模块