一种大模型训练样本重加权方法

AITNT
正文
推荐专利
一种大模型训练样本重加权方法
申请号:CN202411960400
申请日期:2024-12-30
公开号:CN119903341A
公开日期:2025-04-29
类型:发明专利
摘要
本发明公开了一种大模型训练样本重加权方法,属于大模型训练技术领域,方法包括:选取训练集和验证集对大模型进行训练,并利用低秩适应方法将大模型的训练参数的变化量矩阵分解为两个低秩矩阵;基于低秩矩阵,提取训练样本和验证样本通过大模型进行前向传播和反向传播后在低秩适应层上的一维输入激活和一维输出梯度,并根据一维输入激活和一维输出梯度,计算训练样本的权重;基于训练样本的权重,对训练样本的损失值进行加权求和,获取训练样本的总损失,并利用训练样本的总损失对大模型进行反向传播和参数更新。该方法能够高效地为每个训练样本进行加权,减少显存开销。
技术关键词
加权方法 样本 矩阵 模型训练技术 参数 模块 内存 指令
系统为您推荐了相关专利信息
1
一种复合材料防弹头盔结构均匀性的无损检测系统及方法
复合材料防弹头盔 无损检测方法 拓扑图 回波 无损检测系统
2
一种移动式模拟断路器装置和方法
模拟断路器装置 移动式 神经网络模型 保护系统 模拟模型
3
一种基于上气道肌群训练的睡眠呼吸暂停症疗效预测方法
睡眠呼吸暂停症 数据 注意力机制 特征提取器 多层感知器
4
一种风机维修免爬器系统及其控制方法
爬升结构 免爬器 曲线 计划 周期
5
一种CFD和AI耦合通用风机叶片优化方法和系统
风机叶片 模型超参数 拉丁超立方采样 翼型叶片 湍流模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号