多视觉模型的训练方法、多模态任务处理方法以及设备

正文

推荐专利

申请号：CN202510235188

申请日期：2025-02-28

公开号：CN120164058A

公开日期：2025-06-17

类型：发明专利

摘要

本申请提供了一种多视觉模型的训练方法、多模态任务处理方法以及设备，属于人工智能技术领域，训练方法包括：将图像训练数据输入第一视觉模型和第二视觉模型，得到第一图像特征向量和第二图像特征向量；基于第一图像特征向量和第二图像特征向量对混合专家连接器进行训练，得到多模态任务处理模型；多模态任务处理模型包括第一视觉模型、第二视觉模型和训练后的混合专家连接器；训练后的混合专家连接器用于进行第一图像特征与第二图像特征的对齐；多模态任务处理模型用于对包括图像数据在内的多模态数据进行处理得到多模态任务的处理结果。本申请能够基于全面捕获和分析图像特征，提升多模态任务处理模型基于视觉理解处理多模态任务的性能表现。

技术关键词

图像特征向量文本特征向量多模态多视觉数据参数可读存储介质人工智能技术计算机程序产品处理器存储器

系统为您推荐了相关专利信息

一种智能化识别卷式反渗透、纳滤膜元件故障类型的方法

纳滤膜元件性能测试数据变量神经网络算法二分类器

一种旋转工作平台及其海洋工程水池假底设备

旋转工作平台海洋工程模型导向环液压马达支撑臂

一种基于标签的多层容器编排方法及系统

标签数据库多层容器标签协议权重策略编排系统

多模块无线感知系统及其相关设备

解码模块无线感知系统算法引擎数据控制单元计算机可读指令

训练数据集的构建方法、推荐物品的方法及其装置

样本摘要数据移动电子设备图像获取模块

多视觉模型的训练方法、多模态任务处理方法以及设备

站点导航

APP 下载