一种基于文本反转与协同可变形聚合的多模态目标重识别方法

正文

推荐专利

申请号：CN202510401362

申请日期：2025-04-01

公开号：CN120318760A

公开日期：2025-07-15

类型：发明专利

摘要

本发明属于人工智能及深度学习的技术领域，提供了一种基于逆转文本与协同可变形聚合的多模态目标重识别方法，通过设计逆转网络，嵌入现有的多模态融合方法，结合自适应的协同可变形聚合模块，实现全局特征与局部判决性特征的高效交互，最终提升模型在全天候重识别任务中的性能。本发明使现有的目标重识别文本标注成本大幅下降，并首次提出针对红外图像标注以及多模态文本信息融合冲突的解决方案，在大规模数据集上取得了全球领先性能，有效地解决了现有多模态目标重识别领域缺乏文本标注的问题，降低了模型训练成本，为其他多光谱任务如追踪，检测等提供了新的研究范式。

技术关键词

特征提取模块重识别方法文本编码器图像块特征网络多模态多层感知机双线性插值方法标记模态特征交叉注意力机制语义特征混合器可见光图像查询特征融合方法

系统为您推荐了相关专利信息

一种径流预测方法、装置及存储介质

径流预测方法误差校正水文模型气象网格

一种基于掩码自编码的自监督异常检测方法

异常检测方法区块链交易数据掩码策略重构误差深度神经网络结构

一种基于大语言模型的安全知识生成方法和系统

网络流量日志大语言模型动态更新动态记忆网络注意力机制

基于卷积神经网络的屈曲支撑结构抗力预测系统及方法

受力预测系统指数损失率卷积神经网络模型

一种基于机器视觉的老年患者吞咽障碍风险识别方法及系统

风险识别模型患者网络结构优化实时图像风险识别方法

一种基于文本反转与协同可变形聚合的多模态目标重识别方法

站点导航

APP 下载