摘要
本发明公开了一种大模型训练样本重加权方法,属于大模型训练技术领域,方法包括:选取训练集和验证集对大模型进行训练,并利用低秩适应方法将大模型的训练参数的变化量矩阵分解为两个低秩矩阵;基于低秩矩阵,提取训练样本和验证样本通过大模型进行前向传播和反向传播后在低秩适应层上的一维输入激活和一维输出梯度,并根据一维输入激活和一维输出梯度,计算训练样本的权重;基于训练样本的权重,对训练样本的损失值进行加权求和,获取训练样本的总损失,并利用训练样本的总损失对大模型进行反向传播和参数更新。该方法能够高效地为每个训练样本进行加权,减少显存开销。
技术关键词
加权方法
样本
矩阵
模型训练技术
参数
模块
内存
指令
系统为您推荐了相关专利信息
复合材料防弹头盔
无损检测方法
拓扑图
回波
无损检测系统
模拟断路器装置
移动式
神经网络模型
保护系统
模拟模型
睡眠呼吸暂停症
数据
注意力机制
特征提取器
多层感知器
风机叶片
模型超参数
拉丁超立方采样
翼型叶片
湍流模型