一种基于煤矿场景的跨模态行人重识别方法

AITNT
正文
推荐专利
一种基于煤矿场景的跨模态行人重识别方法
申请号:CN202411828573
申请日期:2024-12-12
公开号:CN119785380B
公开日期:2025-07-01
类型:发明专利
摘要
本发明属于跨模态行人重识别领域,公开了一种基于煤矿场景的跨模态行人重识别方法,该方法包括:步骤1、获取表示行人图像的身份及行人图像对应的身份标签,并进行预处理;步骤2、构建跨模态行人重识别主干网络;步骤3、构建多尺度特征增强模块并加入跨模态行人重识别主干网络中;步骤4、确定损失函数,完成跨模态行人重识别主干网络的最终训练;步骤5、将其中一个模态行人图像作为查询集,另一模态行人图像作为待检索集,将查询集中的行人图像与待检索集中的行人图像进行匹配,得到跨模态行人重识别结果。本发明可有效融合跨模态间的图像特征和有效挖掘行人图像的特征信息,有效提升了模型在跨模态行人图像检索场景下的预测能力和泛化能力。
技术关键词
行人重识别 可见光图像 重识别方法 跨模态 交叉注意力机制 关系建模 红外光 编码器 三元组损失函数 语义 离散余弦变换 多尺度特征 预训练模型 样本 场景 文本
系统为您推荐了相关专利信息
1
基于对比学习的多级跨模态对齐方法
跨模态 对齐方法 交叉注意力机制 条件随机场 文本编码器
2
一种用于对象标识来确定无人机飞行路径的方法及系统
无人机飞行路径 三维语义地图 运动轨迹预测 标识 对象
3
一种基于文本掩码协作提示的弱监督语义分割方法及系统
语义分割方法 语义分割模型 抑制背景噪声 种子 掩模
4
一种基于深度学习的电网运维数据故障预警方法及系统
故障预警方法 运维 神经网络训练 记忆 动态权重分配
5
一种基于多模态AI大模型的CIM智能决策方法及系统
智能决策系统 智能决策方法 多模态 数据采集模块 数据分析模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号