一种基于模态调和的多模态模型训练方法及装置

正文

推荐专利

申请号：CN202410778100

申请日期：2024-06-17

公开号：CN118735005A

公开日期：2024-10-01

类型：发明专利

摘要

本发明提出一种基于模态调和的多模态模型训练方法和装置，包括：获取已标注类别标签的多模态数据，并将其转化为符合模型结构输入的指定形式，得到训练数据。构建包括多个学习器的多模态模型，每个学习器对应一种模态，用于提取对应模态数据的特征，根据各学习器提取的特征进行分类，通过分类结果和该类别标签构建损失函数，依次交替训练每一个模态的学习器，以完成对该多模态模型的训练；将待分类多模态数据输入训练完成后的多模态模型，得到每个学习器的输出特征，融合所有该输出特征，得到该待分类多模态数据的分类结果。

技术关键词

学习器模型训练方法输出特征模型训练装置随机梯度下降信息显示设备多模态标签人工智能模型深度图语义电子设备数据处理模块算法参数图像

系统为您推荐了相关专利信息

一种人体运动序列的生成模型训练方法、生成方法及系统

火柴运动向量线条运动编码器运动噪声

一种视网膜图像分层模型训练方法、装置、设备和介质

视网膜图像分层计算机可执行指令模型训练方法训练集标签

一种面向宇航通信领域的宇航用AI芯片性能测评方法

性能测评方法宇航通信训练神经网络芯片线性单元

一种基于优化YOLOv11模型的夜间车辆检测方法

夜间车辆检测方法蒙特卡洛双向特征金字塔检测网络模型特征提取模块

一种基于姿态估计的轻量级仰卧起坐检测方法

注意力特征提取网络姿态估计人体骨架卷积模块

一种基于模态调和的多模态模型训练方法及装置

站点导航

APP 下载