一种文本检索行人重识别的数据增强方法

正文

推荐专利

一种文本检索行人重识别的数据增强方法

申请号：CN202411804740

申请日期：2024-12-10

公开号：CN120431621A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了一种文本检索行人重识别的数据增强方法，步骤包括：在大模型驱动下进行图文语义分区，再通过文本编码器和视觉编码器提取全局文本和图像与局部文本和图像的特征，然后进行全局特征和局部特征的提取，再进行全局特征Mixup和局部特征Mixup，最后训练模型。本发明采用Mixup数据增强方法，通过更精细的图像分区和更丰富的文本语义，实现在图文特征区域之间的一一对应，既进行整体对齐，也进行局部对齐，从而增强图像与文本之间的全局和局部特征的空间关系紧密性，从而提高了模型的鲁棒性与泛用性，增强了图文检索的精度，提高文本检索行人重识别模型的跨域泛化能力，缓解了图文数据的区域不对称问题。

技术关键词

图像嵌入文本编码器局部图像特征排序损失注意力语句行人重识别模型 sigmoid函数数据图文矩阵语义图像编码器分区词特征代表分支

系统为您推荐了相关专利信息

基于数字孪生辅助的轴承智能故障诊断方法

智能故障诊断方法时域编码器动态仿真模型轴承故障诊断拉普拉斯

基于深度学习的异常设施的检测方法、装置及电子设备

融合特征子模块特征提取模块语义空洞

基于增强自注意力特征的半监督医学图像分割方法

医学图像分割网络医学图像分割方法注意力全局平均池化前馈神经网络

一种基于特征增强的多模态图文篡改检测与定位方法

图像编码器图像增强分块DCT变换文本编码器频域特征

一种基于课程管理的交互式处理方法及装置

个性化学习路径数据知识点智能教育技术正确率

一种文本检索行人重识别的数据增强方法

站点导航

APP 下载