一种基于深度文本-视觉模态对齐与融合的再识别方法

正文

推荐专利

申请号：CN202411677994

申请日期：2024-11-22

公开号：CN119693683B

公开日期：2025-12-26

类型：发明专利

摘要

本发明公开了一种基于深度文本‑视觉模态对齐与融合的再识别方法，属于计算机视觉和模式识别领域，该方法设计了一种文本‑视觉模态对齐与融合的深度神经网络，包含文本描述生成模块，视觉特征编码模块，文本特征编码模块和文本‑视觉特征融合模块；该方法首先利用视觉问答生成图像对应实例级文本描述，再通过深度耦合的视觉编码器和文本编码器两个特征提取分支分别生成强对齐的视觉特征和文本特征，最后采用文本‑视觉模态对齐融合技术，联合域无关归一化，增强图像目标前景特征表示,再联合实例归一化提取最终特征，然后利用损失函数模型训练，实现再识别任务。本发明提出的方法能够有效增强目标再识别模型的跨域泛化性能。

技术关键词

文本编码器数据图像块命名方法识别方法视觉特征编码交叉注意力机制图像增强询问方法相机归一化模块颜色校准深度神经网络处理器标签

系统为您推荐了相关专利信息

一种基于自适应内容引导融合机制和多尺度门控卷积的miRNA-疾病关联预测方法

矩阵代表疾病关联预测方法语义 sigmoid函数

基于大数据融合分析的工地离网供电优化系统

供电优化系统工地资源离网供电系统实时监测数据

一种多功能光纤传感器

多功能光纤传感器光电探测器阵列数据处理模块光纤布拉格光栅分光器件

心脏CTA影像的处理方法、装置、设备和介质

医学图像分割形态学特征心脏影像感兴趣

一种教学案例评估分析系统及方法

评估分析系统关键字融合分子子模块教学

一种基于深度文本-视觉模态对齐与融合的再识别方法

站点导航

APP 下载