摘要
本发明属于人工智能及深度学习的技术领域,提供了一种基于逆转文本与协同可变形聚合的多模态目标重识别方法,通过设计逆转网络,嵌入现有的多模态融合方法,结合自适应的协同可变形聚合模块,实现全局特征与局部判决性特征的高效交互,最终提升模型在全天候重识别任务中的性能。本发明使现有的目标重识别文本标注成本大幅下降,并首次提出针对红外图像标注以及多模态文本信息融合冲突的解决方案,在大规模数据集上取得了全球领先性能,有效地解决了现有多模态目标重识别领域缺乏文本标注的问题,降低了模型训练成本,为其他多光谱任务如追踪,检测等提供了新的研究范式。
技术关键词
特征提取模块
重识别方法
文本编码器
图像块特征
网络
多模态
多层感知机
双线性插值方法
标记
模态特征
交叉注意力机制
语义特征
混合器
可见光图像
查询特征
融合方法
系统为您推荐了相关专利信息
异常检测方法
区块链交易数据
掩码策略
重构误差
深度神经网络结构
网络流量日志
大语言模型
动态更新
动态记忆网络
注意力机制
风险识别模型
患者
网络结构优化
实时图像
风险识别方法