基于贡献矩阵的训练数据集的采样权重调整方法及装置

AITNT
正文
推荐专利
基于贡献矩阵的训练数据集的采样权重调整方法及装置
申请号:CN202510793198
申请日期:2025-06-13
公开号:CN120873583A
公开日期:2025-10-31
类型:发明专利
摘要
本申请公开了一种基于贡献矩阵的训练数据集的采样权重调整方法,包括如下步骤。步骤S1:准备多个训练数据集、多个测试数据集、基准大语言模型。步骤S2:采用全部训练数据集分别对基准大语言模型进行训练,称为第一训练过程;通过第一训练过程计算表征每一个训练数据集对每一个测试数据集的贡献值的贡献矩阵。步骤S3:采用全部训练数据集同时对基准大语言模型进行第二训练过程,利用贡献矩阵在基准大语言模型的第二训练过程中动态调整各个训练数据集的采样权重。本申请计算各个训练数据集对基准大语言模型在不同测试数据集上损失的影响,动态调整各个训练数据集的采样权重。
技术关键词
大语言模型 基准 数据 矩阵 梯度下降算法 参数 元素 动态 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号