一种基于文本提示的语义引导的行人重识别方法和系统

AITNT
正文
推荐专利
一种基于文本提示的语义引导的行人重识别方法和系统
申请号:CN202410736218
申请日期:2024-06-07
公开号:CN120032307A
公开日期:2025-05-23
类型:发明专利
摘要
本发明属于信息技术领域,涉及一种基于文本提示的语义引导的行人重识别方法和系统。该方法包括:将训练图像输入视觉编码器,得到视觉嵌入;利用逆向网络将视觉嵌入映射到文本空间,得到伪令牌,将伪令牌整合到自然语言句子中,得到对于输入图像的语言提示;将语言提示输入文本编码器中,得到文本嵌入;利用视觉嵌入和文本嵌入训练多模态交互模块;将查询图片输入训练完成的多模态交互模块,获得融合视觉与文本信息的特征向量,利用融合视觉与文本信息的特征向量在行人图像数据库中执行相似度检索,得到行人重识别结果。本发明在现有行人重识别数据集上的检索性能得到了显著提升。
技术关键词
文本编码器 多模态交互 融合视觉 重识别方法 令牌 行人重识别数据 行人重识别系统 存储计算机程序 自然语言 图像块 样本 注意力 身份 语义 可读存储介质 图片
系统为您推荐了相关专利信息
1
一种设备身份认证方法及系统
设备身份认证方法 待认证 令牌 算法 策略
2
基于原型匹配的文本信息引导的自进化目标检测方法
原型 文本编码器 注意力机制 跨模态 图像编码器
3
一种基于AI和大数据深度融合的城市轨道交通智慧客服中心系统
多模态交互 动态资源调度 客服 数字孪生 票务管理
4
一种提升视觉语言大模型第一人称推理能力的方法及系统
图像视觉特征 文本编码器 图像编码 主动学习策略 尺寸
5
一种基于北斗短报文的自适应组包数据传输系统及方法
北斗短报文 数据传输系统 协议转换模块 串口通信模块 北斗指挥机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号