一种基于伪文本生成的跨模态行人重识别方法

AITNT
正文
推荐专利
一种基于伪文本生成的跨模态行人重识别方法
申请号:CN202510476162
申请日期:2025-04-16
公开号:CN120375424A
公开日期:2025-07-25
类型:发明专利
摘要
本发明涉及一种基于伪文本生成的跨模态行人重识别方法,属于跨模态行人重识别领域。在特征提取阶段,采用CLIP语言视觉预训练模型获取图像和文本的全局与局部语义表示,并通过特征融合模块生成加权融合特征以增强细粒度表征能力。在噪声识别阶段,提出双分量高斯混合模型对图文特征的损失分布进行建模,自动识别并筛除图文匹配中的异常样本。随后,利用多模态大语言模型对噪声图像进行推理,在线生成伪文本以替代原始噪声描述,实现数据增强与文本修复。在优化阶段,引入一种新颖的三元组跨模态对齐损失函数,对文本与图像之间的语义关系进行显式建模与对齐。整体方法实现了数据清洗、语义补全与鲁棒训练的统一。
技术关键词
重识别方法 文本 高斯混合模型 大语言模型 图文 行人重识别 三元组 噪声识别 跨模态 样本 多模态 语义特征 融合特征 图像特征提取 图像块 分辨率 整体方法 预训练模型
系统为您推荐了相关专利信息
1
基于大语言模型的最小化修改程序修复方法、装置及系统和存储介质
大语言模型 程序修复方法 抽象语法树 程序修复系统 多层堆叠层
2
一种基于注意力分数的文本对抗攻击方法
注意力 文本 样本 序列 单层感知机
3
一种基于大语言模型token的文本通用程度评分方法
文本 评分方法 分词算法 大语言模型 模型预训练
4
一种结合AI智能的规则引擎定位方法
定位方法 在线学习机制 模糊匹配算法 模型超参数 格式化
5
一种基于大模型的对抗扰动生成方法
电磁 生成方法 多模态 样本 信号调制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号