指令监督微调的自适应数据配比方法及装置

正文

推荐专利

指令监督微调的自适应数据配比方法及装置

申请号：CN202510287685

申请日期：2025-03-12

公开号：CN120353889A

公开日期：2025-07-22

类型：发明专利

摘要

本申请实施例提供指令监督微调的自适应数据配比方法及装置，涉及人工智能技术领域。该方法对于参考语言模型，基于对于任务类型的基线权重区间进行至少一轮的参数搜索得到配比参数，根据每个任务类型的配比参数得到参考语言模型的任务配比，对参考语言模型的模型参数量和对应的任务配比进行模型拟合得到比例预测模型，基于目标大语言模型的模型参数量，利用比例预测模型进行预测得到目标任务配比。通过对多个小参数量的模型进行任务配比的最优搜索，生成多组模型参数量与任务配比的数据对，以此训练比例预测模型，对大规模参数的目标大语言模型进行自动预测获得可靠性较高的目标任务比例，显著提升指令监督微调的性能和效率。

技术关键词

配比方法大语言模型样本参数指令基线数据策略性能预测模型配比装置人工智能技术邻域搜索模块复杂度电子设备处理器度量存储器标签

系统为您推荐了相关专利信息

营配贯通配网一张图生成方法、装置、设备及存储介质

配电网模型数据生成方法配网布局规则变电站模型文件

一种基于前景理论和强化学习的自动交易方法及系统

自动交易方法进化算法理论自动交易系统动态

一种温度传感器校准方法

温度传感器时间偏移量测量点校准基准电压

深度学习模型的数据检测方法、装置、计算机可读存储介质和处理器

深度学习模型参数数据检测方法长短期记忆网络概率密度曲线

路口场景变更感知的全景图像自适应更新方法

路口场景图像更新方法混合高斯模型摄像设备

指令监督微调的自适应数据配比方法及装置

站点导航

APP 下载