一种文本检索行人重识别的数据增强方法

AITNT
正文
推荐专利
一种文本检索行人重识别的数据增强方法
申请号:CN202411804740
申请日期:2024-12-10
公开号:CN120431621A
公开日期:2025-08-05
类型:发明专利
摘要
本发明公开了一种文本检索行人重识别的数据增强方法,步骤包括:在大模型驱动下进行图文语义分区,再通过文本编码器和视觉编码器提取全局文本和图像与局部文本和图像的特征,然后进行全局特征和局部特征的提取,再进行全局特征Mixup和局部特征Mixup,最后训练模型。本发明采用Mixup数据增强方法,通过更精细的图像分区和更丰富的文本语义,实现在图文特征区域之间的一一对应,既进行整体对齐,也进行局部对齐,从而增强图像与文本之间的全局和局部特征的空间关系紧密性,从而提高了模型的鲁棒性与泛用性,增强了图文检索的精度,提高文本检索行人重识别模型的跨域泛化能力,缓解了图文数据的区域不对称问题。
技术关键词
图像嵌入 文本编码器 局部图像特征 排序损失 注意力 语句 行人重识别模型 sigmoid函数 数据 图文 矩阵 语义 图像编码器 分区 词特征 代表 分支
系统为您推荐了相关专利信息
1
基于数字孪生辅助的轴承智能故障诊断方法
智能故障诊断方法 时域编码器 动态仿真模型 轴承故障诊断 拉普拉斯
2
基于深度学习的异常设施的检测方法、装置及电子设备
融合特征 子模块 特征提取模块 语义 空洞
3
基于增强自注意力特征的半监督医学图像分割方法
医学图像分割网络 医学图像分割方法 注意力 全局平均池化 前馈神经网络
4
一种基于特征增强的多模态图文篡改检测与定位方法
图像编码器 图像增强 分块DCT变换 文本编码器 频域特征
5
一种基于课程管理的交互式处理方法及装置
个性化学习路径 数据 知识点 智能教育技术 正确率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号