摘要
本申请公开了一种行人图像的识别方法、装置、电子设备及计算机程序产品。涉及金融科技领域,该方法包括:获取金融机构在预设时间段的第一模态视频,对第一模态视频进行处理,得到M个第一模态图像;获取第二模态图像,将M个第一模态图像和第二模态图像输入行人识别模型,输出图像识别结果,其中,M个第一模态图像和第二模态图像不同;从图像识别结果中确定数值最大的图像相似度,在数值最大的图像相似度大于预设阈值的情况下,根据数值最大的图像相似度从M个第一模态图像中提取目标第一模态图像。通过本申请,解决了相关技术中因模态差异和背景干扰导致金融机构的安防设备的跨模态行人识别精确度低的技术问题。
技术关键词
行人识别
模态特征
特征提取模块
行人检测算法
识别方法
可见光视频
计算机程序产品
热力图
可见光图像
池化特征
跨模态
数值
姿态估计
数据
卷积模块
关键点
时间段