摘要
本申请提供了一种行人图文匹配方法、装置及终端设备,适用于数据处理技术领域,该方法包括:获取行人图像信息以及行人文本信息;基于多个预设的尺度特征窗口,分别对所述行人图像信息以及所述行人文本信息进行提取,得到图像对齐特征以及文本对齐特征;基于预设的图像增强模型,对所述图像对齐特征进行增强处理,得到图像匹配特征;基于预设的文本增强模型,对所述行人文本信息以及所述文本对齐特征进行增强处理,得到文本匹配特征;根据所述图像匹配特征以及所述文本匹配特征,进行目标行人的匹配。本申请通过将摄像机拍摄到的行人图像与目击者对行人的描述进行匹配,从而通过语言描述来搜索对应的人物图像,以实现对于目标人员的识别与追踪。
技术关键词
图文匹配方法
文本
图像匹配
图像增强模型
特征窗口
人物特征
节点
矩阵
终端设备
语义
数据处理技术
身体
匹配模块
处理器
掩膜
存储器
摄像机
数值
系统为您推荐了相关专利信息
人工智能模型
数据获取模块
因子
多模态特征融合
场景
运维
信息反馈方法
语音输入信息
多模态
信息检索