一种基于煤矿场景的跨模态行人重识别方法

正文

推荐专利

一种基于煤矿场景的跨模态行人重识别方法

申请号：CN202411828573

申请日期：2024-12-12

公开号：CN119785380B

公开日期：2025-07-01

类型：发明专利

摘要

本发明属于跨模态行人重识别领域，公开了一种基于煤矿场景的跨模态行人重识别方法，该方法包括：步骤1、获取表示行人图像的身份及行人图像对应的身份标签，并进行预处理；步骤2、构建跨模态行人重识别主干网络；步骤3、构建多尺度特征增强模块并加入跨模态行人重识别主干网络中；步骤4、确定损失函数，完成跨模态行人重识别主干网络的最终训练；步骤5、将其中一个模态行人图像作为查询集，另一模态行人图像作为待检索集，将查询集中的行人图像与待检索集中的行人图像进行匹配，得到跨模态行人重识别结果。本发明可有效融合跨模态间的图像特征和有效挖掘行人图像的特征信息，有效提升了模型在跨模态行人图像检索场景下的预测能力和泛化能力。

技术关键词

行人重识别可见光图像重识别方法跨模态交叉注意力机制关系建模红外光编码器三元组损失函数语义离散余弦变换多尺度特征预训练模型样本场景文本

系统为您推荐了相关专利信息

基于对比学习的多级跨模态对齐方法

跨模态对齐方法交叉注意力机制条件随机场文本编码器

一种用于对象标识来确定无人机飞行路径的方法及系统

无人机飞行路径三维语义地图运动轨迹预测标识对象

一种基于文本掩码协作提示的弱监督语义分割方法及系统

语义分割方法语义分割模型抑制背景噪声种子掩模

一种基于深度学习的电网运维数据故障预警方法及系统

故障预警方法运维神经网络训练记忆动态权重分配

一种基于多模态AI大模型的CIM智能决策方法及系统

智能决策系统智能决策方法多模态数据采集模块数据分析模块

一种基于煤矿场景的跨模态行人重识别方法

站点导航

APP 下载