一种基于模态统一表示的多模态统一目标跟踪方法

正文

推荐专利

申请号：CN202510193101

申请日期：2025-02-21

公开号：CN119672071B

公开日期：2025-06-10

类型：发明专利

摘要

本发明属于机器学习、计算机视觉、目标跟踪领域，公开了一种基于模态统一表示的多模态统一目标跟踪方法。通过一个多模态嵌入层，将可见光、深度、红外、事件、自然语言模态表示为统一的标记形式，使得训练一个Transformer模型对多种模态的联合特征提取与融合成为可能，从而开发可处理不同的多模态输入信号的目标跟踪模型。此外，本方法中引入任务识别训练策略以增强模型分辨不同模态跟踪任务的能力，提出软标记类型嵌入提供给模型精确的标记类型信息，进一步提升该多模态统一模型性能表现。最终，本方法通过统一的方案解决了不同的多模态跟踪任务，实现了不同任务间的架构统一、模型统一、知识共享，在五种多模态跟踪任务上取得良好的跟踪性能。

技术关键词

可见光多模态标记自然语言联合特征提取图像块跟踪方法多层感知机数据文本编码器置信度阈值生成模板通道计算机视觉注意力机制动态更新策略

系统为您推荐了相关专利信息

一种面向老年人的公交出行信息提示方法及系统

出行信息提示方法面向老年人出行规律电子地图数据应用程序账号

辅助驾驶系统

辅助驾驶系统透明显示模块传感模块辅助驾驶信息主机

一种基于机器学习的BIM高层悬挂结构监测方法及系统

悬挂结构注意力 BIM模型数据监测方法物理

一种3D堆叠芯片的对准检测装置及方法

对准检测装置堆叠芯片对准标记对准检测方法移动台

可穿戴式设备的佩戴舒适度测试方法及电子设备

可穿戴式设备运动模拟装置仿真人体坐标系指标

一种基于模态统一表示的多模态统一目标跟踪方法

站点导航

APP 下载