大模型训练方法、装置、电子设备、存储介质和程序产品

AITNT
正文
推荐专利
大模型训练方法、装置、电子设备、存储介质和程序产品
申请号:CN202510743643
申请日期:2025-06-05
公开号:CN120610798A
公开日期:2025-09-09
类型:发明专利
摘要
本公开涉及一种大模型训练方法、装置、电子设备、存储介质和程序产品。所述方法包括:对于目标大模型的任意一项训练数据,将所述训练数据切分为多份分段数据,并将多份分段数据存储在非易失性存储器中,其中,多份分段数据依次进行前向传播计算和反向传播计算;对于任意一份分段数据,从非易失性存储器读取所述分段数据至显存,并通过GPU对所述分段数据执行前向传播计算,得到所述分段数据对应的激活值;对于任意一份分段数据,通过GPU基于所述分段数据对应的激活值执行反向传播计算,得到所述分段数据对应的梯度数据,并将所述分段数据对应的梯度数据从显存移动至非易失性存储器或者CPU内存。本公开能够降低激活值的显存占用。
技术关键词
分段 非易失性存储器 多层感知器 计算机可读代码 模型训练方法 内存 计算机程序指令 电子设备 数据存储 模型训练装置 可读存储介质 并行工作 计算机程序产品 处理器 参数 注意力
系统为您推荐了相关专利信息
1
报文硬件转发方法和网络设备
报文 转发方法 硬件路由表 芯片 网络设备
2
自动化的传感器性能监测预警系统
监测预警系统 邻域传感器 历史监测数据 LSTM神经网络 组合模块
3
高斯编码模型训练方法、室内占用预测方法、设备和介质
室内场景图像 编码模型训练方法 样本 编码器 混合模块
4
基于测试用例的模型训练方法、异常检测方法及储能设备
储能设备 模型训练方法 异常检测方法 知识蒸馏技术 联邦学习技术
5
模型训练方法、策略生成方法、装置、电子设备及介质
缓存策略 基站 执行内容推荐 编码 终端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号