基于细粒度调度的模型训练方法、装置、设备和存储介质

正文

推荐专利

申请号：CN202411657605

申请日期：2024-11-19

公开号：CN119597471A

公开日期：2025-03-11

类型：发明专利

摘要

本申请涉及一种基于细粒度调度的模型训练方法、装置、设备和存储介质，通过获取第一样本序列；将第一样本序列输入至模型进行训练，并在训练过程中为各第一样本序列分配显存空间，以及对各第一样本序列基于单独线程进行运算；在有任一第一样本序列完成反向传播的情况下，释放该第一样本序列占用的显存空间，并将新的第二样本序列输入至模型进行训练；解决了大语言模型在训练过程中存在运算资源浪费的问题。

技术关键词

模型训练方法样本序列计数器标志位模型训练装置参数处理器计算机设备输入模块可读存储介质存储器资源

系统为您推荐了相关专利信息

一种智能体指令对齐与数据库自完备方法及系统

指令样本闭环方法语音设备大语言模型

一种基于大语言模型的化肥推荐解释生成方法

大语言模型生成方法化肥文本微调方法

一种基于监测图像的水稻叶片稻瘟病检测方法

检测农田叶片像素点标记色彩

一种基于PSO-GRU的拉索气动特性预测方法及系统

GRU模型气动特征拉索特性预测方法粒子群算法

一种对抗样本生成方法、系统、电子设备、存储介质

样本生成方法注意力生成系统深度学习模型通道

基于细粒度调度的模型训练方法、装置、设备和存储介质

站点导航

APP 下载