一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法

AITNT
正文
推荐专利
一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法
申请号:CN202510124639
申请日期:2025-01-26
公开号:CN120071079B
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法,所述方法针对传统ViT多模态视觉模型在模型训练过程中数据增强对模态缺失情况的模拟能力有限,并且在模型结构设计方面未考虑到模态缺失的情境,提出了考虑模态缺失情境的多模态ViT视觉模型结构,构建步骤如下:步骤一、单模态分支结构设计;步骤二、缺失模态的检测;步骤三、缺失模态的投影;步骤四、多模态融合ViT。本发明妥善处理了模态缺失的情境,在模态缺失的情境下依然能维持较高性能和稳定输出,提升了模型的准确性和鲁棒性,减少了因模态缺失而可能导致的安全隐患。
技术关键词
编码器 视觉 序列特征 多模态 多层感知机 条件指示符 融合特征 图像分割 实例分割 编码特征 模态特征 参数 激光点 激光雷达 动态地 立方体 分支 鲁棒性 坐标
系统为您推荐了相关专利信息
1
基于大数据和能量传递的电视节目收视率预测系统及方法
电视节目收视率 多源异构数据 预测系统 多模态信息融合 多模态数据融合
2
一种农村生活污水资源化利用处理方法及系统
人工湿地植物 训练卷积神经网络模型 滤料 农村 通用分组无线服务技术
3
基于多模态对比学习个体聚焦模型的情感分析方法
情感分析方法 多模态 网络架构 数据 脑电信号特征
4
一种面向多模态数据的图神经网络的分类方法
面向多模态数据 分类方法 节点特征 语言编码器 语义
5
一种商标纸抓取的视觉夹具
海绵吸盘 商标纸 环形光源 工业相机 接近开关
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号