摘要
本申请公开了多模态大模型的训练方法、装置、存储介质和电子设备,训练方法包括:利用预先训练的用于进行标签标注的标签专家LMM,对原始多模态训练数据预测标签;基于答案评级标签对原始多模态训练数据进行过滤,得到过滤数据集;基于过滤数据集中的所有数据样本的图像标签和指令标签,从过滤数据集中选择数据样本作为采样数据,使基于所有采样数据的图像标签和指令标签确定的标签熵最大化;将采样数据作为训练样本进行多模态大模型的训练。应用本申请,能够利用筛选后的训练数据进行多模态大模型训练,并有效保证多模态大模型的性能。
技术关键词
标签
样本
多模态
答案
数据采样单元
指令
种子
模型训练方法
过滤单元
图片
图像类别
可读存储介质
电子设备
标记
计算机
训练装置
处理器
系统为您推荐了相关专利信息
数字孪生模型
教学场景
关键骨骼节点
分辨率
渲染图像数据
化合物分子结构
图像处理
指纹特征提取
图像多尺度
多模态