基于自适应感知的通用型多模态目标跟踪模型、训练方法、应用

正文

推荐专利

申请号：CN202410872684

申请日期：2024-07-01

公开号：CN118674945A

公开日期：2024-09-20

类型：发明专利

摘要

本发明提供一种基于自适应感知的通用型多模态目标跟踪模型、训练方法、应用。具体的，在模型输入层，考虑到可见光模态比红外、深度和事件模态具有更加丰富的语义信息，为了更好的保留这些信息，为可见光模态单独设置了一个嵌入层，为红外、深度和事件模态设置一个共享的嵌入层，这样的设置同样也兼顾了输入层的灵活性，这为了能够对输入模态进行自适应感知，设计了一个简单有效的模态感知模块，能够同时进行特征提取、特征交互和模态感知。在多模态跟踪中，每个模态都包含一些与模态无关的信息，例如目标的形状、运动和上下文信息等。这些信息有助于捕捉不同模态之间共享的语义信息，从而协助模型理解目标的整体上下文。此外，承载着每种模态独特的视角和信息的模态特定特征也十分关键，它可以促进模型对整体信息的理解和处理能力。通过充分利用模态无关特征和模态特定特征，可以提高模型对复杂多模态数据的感知和分析水平，实现更准确、鲁棒的任务执行。

技术关键词

令牌多模态通用型分类器可见光模板模块注意力视觉序列分支数据计算机可读存储介质参数特征选择处理器通信输出特征指令

系统为您推荐了相关专利信息

多维度信息融合的声学侧信道攻击检测识别方法及装置

多维度信息融合检测识别方法网络模块加速度注意力机制

一种基于AIGC的博物馆文化传播系统

文化传播系统文本生成模型分层验证视频特征向量博物馆藏品

一种基于注意力掩膜的红外图像彩色化方法

红外图像彩色化注意力彩色图像掩膜数量编码器

基于多模态AI的景区全域旅游路线动态生成方法和系统

动态生成方法多模态生成方式兴趣指数

基于非平衡特征分布多向对齐的低质量多模态动物图像划分方法

图像划分方法嵌入特征平衡特征多模态动物

基于自适应感知的通用型多模态目标跟踪模型、训练方法、应用

站点导航

APP 下载