基于多模态提示增强的行人重识别方法及装置

正文

推荐专利

申请号：CN202510843124

申请日期：2025-06-23

公开号：CN120913241A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提出了一种基于多模态提示增强的行人重识别方法及装置，其中该方法包括：获取行人图像数据，并进行预处理，以得到训练数据集；构建行人重识别模型，其中，行人重识别模型包括可学习文本初始化模块、文本编码器、图像编码器和多模态Prompt嵌入模块；对训练数据集中的行人图像进行离散小波变换，以得到高频语义信息，并经过映射网络，以得到可学习文本的初始化标签；将训练数据集中的行人图像和可学习文本的初始化标签输入到行人重识别模型进行训练，使得可学习文本特征与行人图像特征对齐，通过行人重识别模型可以根据输入图像找到对应文本描述；由此，能够生成更贴近行人图像的文本描述，从而提升了多摄像头视角下行人身份的识别率。

技术关键词

行人重识别模型重识别方法多模态图像编码器离散小波变换文本编码器语义数据模块标签分支参数视觉处理器线性

系统为您推荐了相关专利信息

一种多模态融合的肌张力动态评估方法和系统

动态评估方法阻力多模态力反馈动态评估技术

飞机交付管理方法、装置、设备及介质

人工智能系统交付管理方法管理信息系统风险文本特征向量

基于CEEMDAN-DBO-BiLSTM光伏出力区间预测方法

区间预测方法双向长短期记忆网络核密度估计方法分布式光伏集合经验模态分解

一种轻量化多模态的茶园采摘机器人控制系统

茶园采摘机器人茶叶嫩芽茶叶识别多模态机器人运动控制

基于多模态反馈的虚拟现实交互训练系统及方法

虚拟现实交互训练场景多模态时空注意力机制渲染架构

基于多模态提示增强的行人重识别方法及装置

站点导航

APP 下载