摘要
本申请涉及一种基于细粒度调度的模型训练方法、装置、设备和存储介质,通过获取第一样本序列;将第一样本序列输入至模型进行训练,并在训练过程中为各第一样本序列分配显存空间,以及对各第一样本序列基于单独线程进行运算;在有任一第一样本序列完成反向传播的情况下,释放该第一样本序列占用的显存空间,并将新的第二样本序列输入至模型进行训练;解决了大语言模型在训练过程中存在运算资源浪费的问题。
技术关键词
模型训练方法
样本
序列
计数器
标志位
模型训练装置
参数
处理器
计算机设备
输入模块
可读存储介质
存储器
资源
系统为您推荐了相关专利信息
GRU模型
气动特征
拉索
特性预测方法
粒子群算法
样本生成方法
注意力
生成系统
深度学习模型
通道