一种基于文本提示的语义引导的行人重识别方法和系统

正文

推荐专利

申请号：CN202410736218

申请日期：2024-06-07

公开号：CN120032307A

公开日期：2025-05-23

类型：发明专利

摘要

本发明属于信息技术领域，涉及一种基于文本提示的语义引导的行人重识别方法和系统。该方法包括：将训练图像输入视觉编码器，得到视觉嵌入；利用逆向网络将视觉嵌入映射到文本空间，得到伪令牌，将伪令牌整合到自然语言句子中，得到对于输入图像的语言提示；将语言提示输入文本编码器中，得到文本嵌入；利用视觉嵌入和文本嵌入训练多模态交互模块；将查询图片输入训练完成的多模态交互模块，获得融合视觉与文本信息的特征向量，利用融合视觉与文本信息的特征向量在行人图像数据库中执行相似度检索，得到行人重识别结果。本发明在现有行人重识别数据集上的检索性能得到了显著提升。

技术关键词

文本编码器多模态交互融合视觉重识别方法令牌行人重识别数据行人重识别系统存储计算机程序自然语言图像块样本注意力身份语义可读存储介质图片

系统为您推荐了相关专利信息

一种设备身份认证方法及系统

设备身份认证方法待认证令牌算法策略

基于原型匹配的文本信息引导的自进化目标检测方法

原型文本编码器注意力机制跨模态图像编码器

一种基于AI和大数据深度融合的城市轨道交通智慧客服中心系统

多模态交互动态资源调度客服数字孪生票务管理

一种提升视觉语言大模型第一人称推理能力的方法及系统

图像视觉特征文本编码器图像编码主动学习策略尺寸

一种基于北斗短报文的自适应组包数据传输系统及方法

北斗短报文数据传输系统协议转换模块串口通信模块北斗指挥机

一种基于文本提示的语义引导的行人重识别方法和系统

站点导航

APP 下载