多模态大模型的训练方法、装置、存储介质和电子设备

AITNT
正文
推荐专利
多模态大模型的训练方法、装置、存储介质和电子设备
申请号:CN202411650667
申请日期:2024-11-19
公开号:CN119150997B
公开日期:2025-03-28
类型:发明专利
摘要
本申请公开了多模态大模型的训练方法、装置、存储介质和电子设备,训练方法包括:利用预先训练的用于进行标签标注的标签专家LMM,对原始多模态训练数据预测标签;基于答案评级标签对原始多模态训练数据进行过滤,得到过滤数据集;基于过滤数据集中的所有数据样本的图像标签和指令标签,从过滤数据集中选择数据样本作为采样数据,使基于所有采样数据的图像标签和指令标签确定的标签熵最大化;将采样数据作为训练样本进行多模态大模型的训练。应用本申请,能够利用筛选后的训练数据进行多模态大模型训练,并有效保证多模态大模型的性能。
技术关键词
标签 样本 多模态 答案 数据采样单元 指令 种子 模型训练方法 过滤单元 图片 图像类别 可读存储介质 电子设备 标记 计算机 训练装置 处理器
系统为您推荐了相关专利信息
1
基于数字孪生的在线教学交互增强方法及系统
数字孪生模型 教学场景 关键骨骼节点 分辨率 渲染图像数据
2
基于自然语言处理的客服问答方法、装置、设备及介质
问答方法 客服 自然语言 消息 实体
3
基于化合物多模态数据的作用机制预测系统及方法
化合物分子结构 图像处理 指纹特征提取 图像多尺度 多模态
4
基于双约束概念分解的半监督多视图聚类方法
矩阵 聚类方法 拉普拉斯 样本 标签
5
一种基于大数据驱动的人工智能教学模型的构建方法
人工智能教学 路径结构 大数据 序列 索引
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号