摘要
本发明公开了一种基于多模态大模型的多模态预训练数据过滤方法,包括如下步骤:步骤一,获取训练模型的多模态预训练数据,并对多模态预训练数据进行分类;步骤二,使用标准视觉指令调整在外部高质量多模态数据上训练参考模型;步骤三,根据参考模型RM得出的对数概率计算所有文本标记的参考损失;步骤四,通过步骤三计算的参考损失对步骤一获取的多模态预训练数据进行排序和筛选数据,获得最终高质量多模态预训练数据。本发明的基于多模态大模型的多模态预训练数据过滤方法,会仔细检查数据集,以找出具有最高代表性和训练价值的数据样本。
技术关键词
数据过滤方法
多模态
文本
标记
图像
视觉
指令
焦点
实体
样本
颜色
序列
系统为您推荐了相关专利信息
关键特征值
机器视觉检测方法
子模块
物体扫描
视觉检测模块
视觉图像识别方法
注意力机制
互补机制
视觉图像识别装置
计算机可读指令
巡检方法
无人机巡检路径
图像处理模型
公路
实时数据
事故现场
物联网应急
策略
通信链路状态
地理位置信息