一种基于文本反转与协同可变形聚合的多模态目标重识别方法

AITNT
正文
推荐专利
一种基于文本反转与协同可变形聚合的多模态目标重识别方法
申请号:CN202510401362
申请日期:2025-04-01
公开号:CN120318760A
公开日期:2025-07-15
类型:发明专利
摘要
本发明属于人工智能及深度学习的技术领域,提供了一种基于逆转文本与协同可变形聚合的多模态目标重识别方法,通过设计逆转网络,嵌入现有的多模态融合方法,结合自适应的协同可变形聚合模块,实现全局特征与局部判决性特征的高效交互,最终提升模型在全天候重识别任务中的性能。本发明使现有的目标重识别文本标注成本大幅下降,并首次提出针对红外图像标注以及多模态文本信息融合冲突的解决方案,在大规模数据集上取得了全球领先性能,有效地解决了现有多模态目标重识别领域缺乏文本标注的问题,降低了模型训练成本,为其他多光谱任务如追踪,检测等提供了新的研究范式。
技术关键词
特征提取模块 重识别方法 文本编码器 图像块特征 网络 多模态 多层感知机 双线性插值方法 标记 模态特征 交叉注意力机制 语义特征 混合器 可见光图像 查询特征 融合方法
系统为您推荐了相关专利信息
1
一种径流预测方法、装置及存储介质
径流预测方法 误差校正 水文模型 气象 网格
2
一种基于掩码自编码的自监督异常检测方法
异常检测方法 区块链交易数据 掩码策略 重构误差 深度神经网络结构
3
一种基于大语言模型的安全知识生成方法和系统
网络流量日志 大语言模型 动态更新 动态记忆网络 注意力机制
4
基于卷积神经网络的屈曲支撑结构抗力预测系统及方法
受力 预测系统 指数 损失率 卷积神经网络模型
5
一种基于机器视觉的老年患者吞咽障碍风险识别方法及系统
风险识别模型 患者 网络结构优化 实时图像 风险识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号