一种基于图文模态分区插值的行人重识别数据增强方法

正文

推荐专利

申请号：CN202411009580

申请日期：2024-07-26

公开号：CN119007242A

公开日期：2024-11-22

类型：发明专利

摘要

本发明公开了一种基于图文模态分区插值的行人重识别数据增强方法，本发明利用语义字典将图像部分和属性词进行映射，然后在此关系下分别对图像部分和局部词汇进行局部线性插值和局部词汇替换，以生成增强的图像‑文本对，然后增强样本和原始样本一并参与模型的训练。本发明所述方法增强模型的泛化能力，对模型融合互补信息，有利于文本检索行人重识别任务精度的提升。本发明通过对图文两个模块分区插值这样输入级的数据增强方法，可以在不改变模型基础组件的前提下，实现特征的有效融合，解决了训练过程中依赖特定参数导致过拟合，限制了模型在未见数据上的泛化能力的问题。

技术关键词

行人重识别数据全局视觉特征图文分区文本行人重识别模型样本 Sigmoid函数局部视觉特征语言编码器图像排序损失字典分块语义算法

系统为您推荐了相关专利信息

一种基于分块并行的超大幅面文档智能识别方法及系统

智能识别方法文本识别模型分块策略分布式计算架构图像数据预处理

显示设备、显示设备的控制方法及手语交互方法

文本处理模型显示设备意图识别手语交互方法历史交互信息

一种数据增强的图学习多模态虚假信息检测方法及系统

虚假信息检测方法文本节点图像 BERT模型

基于强化学习与防护层的3D点云大模型对话安全防护系统及方法

防护系统语义特征对齐模块策略文本

基于大语言模型和Logistic模型的企业财务风险预警方法

风险预警方法 Logistic模型大语言模型文本计算机自然语言

一种基于图文模态分区插值的行人重识别数据增强方法

站点导航

APP 下载