摘要
本申请公开了一种基于贡献矩阵的训练数据集的采样权重调整方法,包括如下步骤。步骤S1:准备多个训练数据集、多个测试数据集、基准大语言模型。步骤S2:采用全部训练数据集分别对基准大语言模型进行训练,称为第一训练过程;通过第一训练过程计算表征每一个训练数据集对每一个测试数据集的贡献值的贡献矩阵。步骤S3:采用全部训练数据集同时对基准大语言模型进行第二训练过程,利用贡献矩阵在基准大语言模型的第二训练过程中动态调整各个训练数据集的采样权重。本申请计算各个训练数据集对基准大语言模型在不同测试数据集上损失的影响,动态调整各个训练数据集的采样权重。
技术关键词
大语言模型
基准
数据
矩阵
梯度下降算法
参数
元素
动态
序列