多模态大模型的指令微调数据选择方法及装置

正文

推荐专利

申请号：CN202410992374

申请日期：2024-07-23

公开号：CN119004099A

公开日期：2024-11-22

类型：发明专利

摘要

本发明提供一种多模态大模型的指令微调数据的选择方法及装置，方法包括：训练一个基于人工反馈的奖励模型并将奖励模型的输出得分最大化作为目标优化多模态大模型，以得到多模态数据集的第一评分公式，奖励模型的输出得分用于对多模态大模型输出结果的质量进行评估；根据低秩适配器和Adam优化器调整第一评分公式，得到第二评分公式；根据第二评分公式，从多模态数据集中获取代表性数据集；从代表性数据集中进行多样性选择，获取既具有代表性，同时具有多样性的多模态大模型的指令微调数据。通过上述方法，使得多模态大模型在进行特定任务训练时，能够获取到高质量的微调数据，提升训练速率。

技术关键词

多模态模态特征指令适配器优化器非暂态计算机可读存储介质数据获取模块协方差矩阵特征值处理器存储器参数电子设备速率程序

系统为您推荐了相关专利信息

基于BIM技术的古建筑数字化方法、系统及相关设备

多源异构数据数字化方法 BIM技术智能识别算法关联规则预测

基于文本的图像检索方法、设备以及存储介质

检索图像局部图像特征文本图像增强图像检索方法

一种基于多标签和多专家网络的侧信道攻击方法

多标签密码算法密钥注意力机制信道

数据同步方法、第一机器人及存储介质

数据同步方法计算机程序指令建立通信控制第一机器人地图

一种设计意图的区域模块化测量方法

测量方法异常信息意图覆盖区偏差

多模态大模型的指令微调数据选择方法及装置

站点导航

APP 下载