摘要
本申请提供了一种多视觉模型的训练方法、多模态任务处理方法以及设备,属于人工智能技术领域,训练方法包括:将图像训练数据输入第一视觉模型和第二视觉模型,得到第一图像特征向量和第二图像特征向量;基于第一图像特征向量和第二图像特征向量对混合专家连接器进行训练,得到多模态任务处理模型;多模态任务处理模型包括第一视觉模型、第二视觉模型和训练后的混合专家连接器;训练后的混合专家连接器用于进行第一图像特征与第二图像特征的对齐;多模态任务处理模型用于对包括图像数据在内的多模态数据进行处理得到多模态任务的处理结果。本申请能够基于全面捕获和分析图像特征,提升多模态任务处理模型基于视觉理解处理多模态任务的性能表现。
技术关键词
图像特征向量
文本特征向量
多模态
多视觉
数据
参数
可读存储介质
人工智能技术
计算机程序产品
处理器
存储器
系统为您推荐了相关专利信息
纳滤膜元件
性能测试数据
变量
神经网络算法
二分类器
旋转工作平台
海洋工程模型
导向环
液压马达
支撑臂
标签数据库
多层容器
标签协议
权重策略
编排系统
解码模块
无线感知系统
算法引擎
数据控制单元
计算机可读指令