摘要
本申请实施例公开了一种大语言模型训练方法及装置。该方法包括:将全量训练数据输入至大模型中进行训练;确定大模型的大模型性能数据;根据大模型性能数据从全量训练数据中选择至少部分训练数据作为目标训练数据,基于目标训练数据对应的大模型性能数据进行参数优化调整;若不满足预设条件,返回从将全量训练数据输入至大模型中进行训练开始继续执行。上述方案根据大模型性能数据选择出相对优质的训练数据,先基于该部分训练数据对应的大模型性能数据进行参数调优,使模型能够快速优化,模型能力提升的情况下,进一步提升了对其他训练数据的学习能力,继续将全量训练数据输入参与参数优化调整,提高了模型训练效率和泛化能力。
技术关键词
数据
大语言模型
参数
标记
训练装置
模块
系统为您推荐了相关专利信息
电流环参数
暂态过电压
变流器
控制参数优化方法
二阶系统
故障检测模型
故障类别
样本
故障检测方法
注意力