一种用于集成多模态行人再识别的跨模态分组对齐方法

正文

推荐专利

申请号：CN202411938930

申请日期：2024-12-26

公开号：CN119832599B

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种用于集成多模态行人再识别的跨模态分组对齐方法，包括以下步骤：S1、利用共享的同一个图像特征提取器对RGB图像和草图进行特征提取，并利用文本特征提取器对文本进行特征提取；S2、使用融合特征提取器对草图和文本的特征进行特征融合；S3、局部特征通过过滤处理将冗余的特征滤除，再通过跨模态域内对比学习模块进行模态间细粒度特征深度融合，实现细粒度特征对齐；S4、全局特征通过超平面约束模块，将同一行人id的三种模态的全局特征在共享空间中的分布约束到一个超平面中；S5、同一个超平面中的全局特征通过对比学习将三种模态进行对齐，最终实现文本检索RGB图像、草图检索RGB图像、文本融合草图检索RGB图像。

技术关键词

行人再识别文本对齐方法细粒度特征图像特征提取模态特征多模态特征提取器融合特征提取矩阵跨模态图像局部特征线性样本令牌冗余立体模块

系统为您推荐了相关专利信息

一种基于多模态AI大模型的软件系统开发方法

软件系统开发方法记忆图谱摘要视角多模态

基于混淆集的特定领域拼写纠错语料构建方法、装置

语料构建方法预训练语言模型纠错语音输入识别语音识别模型

运动轨迹生成方法、装置、电子设备和存储介质

拓扑图关键点运动轨迹生成方法语义特征异质

检索任务处理方法、系统、装置、设备、介质及程序产品

阶段信息检索分析子系统文本生成模型数据

基于多角度图像的多模态问答方法、装置、电子设备

多角度问答方法视觉特征交叉注意力机制多视角特征

一种用于集成多模态行人再识别的跨模态分组对齐方法

站点导航

APP 下载