一种大模型训练样本重加权方法

正文

推荐专利

一种大模型训练样本重加权方法

申请号：CN202411960400

申请日期：2024-12-30

公开号：CN119903341A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种大模型训练样本重加权方法，属于大模型训练技术领域，方法包括：选取训练集和验证集对大模型进行训练，并利用低秩适应方法将大模型的训练参数的变化量矩阵分解为两个低秩矩阵；基于低秩矩阵，提取训练样本和验证样本通过大模型进行前向传播和反向传播后在低秩适应层上的一维输入激活和一维输出梯度，并根据一维输入激活和一维输出梯度，计算训练样本的权重；基于训练样本的权重，对训练样本的损失值进行加权求和，获取训练样本的总损失，并利用训练样本的总损失对大模型进行反向传播和参数更新。该方法能够高效地为每个训练样本进行加权，减少显存开销。

技术关键词

加权方法样本矩阵模型训练技术参数模块内存指令

系统为您推荐了相关专利信息

一种复合材料防弹头盔结构均匀性的无损检测系统及方法

复合材料防弹头盔无损检测方法拓扑图回波无损检测系统

一种移动式模拟断路器装置和方法

模拟断路器装置移动式神经网络模型保护系统模拟模型

一种基于上气道肌群训练的睡眠呼吸暂停症疗效预测方法

睡眠呼吸暂停症数据注意力机制特征提取器多层感知器

一种风机维修免爬器系统及其控制方法

爬升结构免爬器曲线计划周期

一种CFD和AI耦合通用风机叶片优化方法和系统

风机叶片模型超参数拉丁超立方采样翼型叶片湍流模型

一种大模型训练样本重加权方法

站点导航

APP 下载