一种基于伪文本生成的跨模态行人重识别方法

正文

推荐专利

申请号：CN202510476162

申请日期：2025-04-16

公开号：CN120375424A

公开日期：2025-07-25

类型：发明专利

摘要

本发明涉及一种基于伪文本生成的跨模态行人重识别方法，属于跨模态行人重识别领域。在特征提取阶段，采用CLIP语言视觉预训练模型获取图像和文本的全局与局部语义表示，并通过特征融合模块生成加权融合特征以增强细粒度表征能力。在噪声识别阶段，提出双分量高斯混合模型对图文特征的损失分布进行建模，自动识别并筛除图文匹配中的异常样本。随后，利用多模态大语言模型对噪声图像进行推理，在线生成伪文本以替代原始噪声描述，实现数据增强与文本修复。在优化阶段，引入一种新颖的三元组跨模态对齐损失函数，对文本与图像之间的语义关系进行显式建模与对齐。整体方法实现了数据清洗、语义补全与鲁棒训练的统一。

技术关键词

重识别方法文本高斯混合模型大语言模型图文行人重识别三元组噪声识别跨模态样本多模态语义特征融合特征图像特征提取图像块分辨率整体方法预训练模型

系统为您推荐了相关专利信息

基于大语言模型的最小化修改程序修复方法、装置及系统和存储介质

大语言模型程序修复方法抽象语法树程序修复系统多层堆叠层

一种基于注意力分数的文本对抗攻击方法

注意力文本样本序列单层感知机

一种基于大语言模型token的文本通用程度评分方法

文本评分方法分词算法大语言模型模型预训练

一种结合AI智能的规则引擎定位方法

定位方法在线学习机制模糊匹配算法模型超参数格式化

一种基于大模型的对抗扰动生成方法

电磁生成方法多模态样本信号调制

一种基于伪文本生成的跨模态行人重识别方法

站点导航

APP 下载