一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法

正文

推荐专利

申请号：CN202510124639

申请日期：2025-01-26

公开号：CN120071079B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法，所述方法针对传统ViT多模态视觉模型在模型训练过程中数据增强对模态缺失情况的模拟能力有限，并且在模型结构设计方面未考虑到模态缺失的情境，提出了考虑模态缺失情境的多模态ViT视觉模型结构，构建步骤如下：步骤一、单模态分支结构设计；步骤二、缺失模态的检测；步骤三、缺失模态的投影；步骤四、多模态融合ViT。本发明妥善处理了模态缺失的情境，在模态缺失的情境下依然能维持较高性能和稳定输出，提升了模型的准确性和鲁棒性，减少了因模态缺失而可能导致的安全隐患。

技术关键词

编码器视觉序列特征多模态多层感知机条件指示符融合特征图像分割实例分割编码特征模态特征参数激光点激光雷达动态地立方体分支鲁棒性坐标

系统为您推荐了相关专利信息

基于大数据和能量传递的电视节目收视率预测系统及方法

电视节目收视率多源异构数据预测系统多模态信息融合多模态数据融合

一种农村生活污水资源化利用处理方法及系统

人工湿地植物训练卷积神经网络模型滤料农村通用分组无线服务技术

基于多模态对比学习个体聚焦模型的情感分析方法

情感分析方法多模态网络架构数据脑电信号特征

一种面向多模态数据的图神经网络的分类方法

面向多模态数据分类方法节点特征语言编码器语义

一种商标纸抓取的视觉夹具

海绵吸盘商标纸环形光源工业相机接近开关

一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法

站点导航

APP 下载