一种基于图文模态分区插值的行人重识别数据增强方法

AITNT
正文
推荐专利
一种基于图文模态分区插值的行人重识别数据增强方法
申请号:CN202411009580
申请日期:2024-07-26
公开号:CN119007242A
公开日期:2024-11-22
类型:发明专利
摘要
本发明公开了一种基于图文模态分区插值的行人重识别数据增强方法,本发明利用语义字典将图像部分和属性词进行映射,然后在此关系下分别对图像部分和局部词汇进行局部线性插值和局部词汇替换,以生成增强的图像‑文本对,然后增强样本和原始样本一并参与模型的训练。本发明所述方法增强模型的泛化能力,对模型融合互补信息,有利于文本检索行人重识别任务精度的提升。本发明通过对图文两个模块分区插值这样输入级的数据增强方法,可以在不改变模型基础组件的前提下,实现特征的有效融合,解决了训练过程中依赖特定参数导致过拟合,限制了模型在未见数据上的泛化能力的问题。
技术关键词
行人重识别数据 全局视觉特征 图文 分区 文本 行人重识别模型 样本 Sigmoid函数 局部视觉特征 语言编码器 图像 排序损失 字典 分块 语义 算法
系统为您推荐了相关专利信息
1
一种基于分块并行的超大幅面文档智能识别方法及系统
智能识别方法 文本识别模型 分块策略 分布式计算架构 图像数据预处理
2
显示设备、显示设备的控制方法及手语交互方法
文本处理模型 显示设备 意图识别 手语交互方法 历史交互信息
3
一种数据增强的图学习多模态虚假信息检测方法及系统
虚假信息检测方法 文本 节点 图像 BERT模型
4
基于强化学习与防护层的3D点云大模型对话安全防护系统及方法
防护系统 语义特征 对齐模块 策略 文本
5
基于大语言模型和Logistic模型的企业财务风险预警方法
风险预警方法 Logistic模型 大语言模型 文本 计算机自然语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号