基于细粒度调度的模型训练方法、装置、设备和存储介质

AITNT
正文
推荐专利
基于细粒度调度的模型训练方法、装置、设备和存储介质
申请号:CN202411657605
申请日期:2024-11-19
公开号:CN119597471A
公开日期:2025-03-11
类型:发明专利
摘要
本申请涉及一种基于细粒度调度的模型训练方法、装置、设备和存储介质,通过获取第一样本序列;将第一样本序列输入至模型进行训练,并在训练过程中为各第一样本序列分配显存空间,以及对各第一样本序列基于单独线程进行运算;在有任一第一样本序列完成反向传播的情况下,释放该第一样本序列占用的显存空间,并将新的第二样本序列输入至模型进行训练;解决了大语言模型在训练过程中存在运算资源浪费的问题。
技术关键词
模型训练方法 样本 序列 计数器 标志位 模型训练装置 参数 处理器 计算机设备 输入模块 可读存储介质 存储器 资源
系统为您推荐了相关专利信息
1
一种智能体指令对齐与数据库自完备方法及系统
指令 样本 闭环方法 语音设备 大语言模型
2
一种基于大语言模型的化肥推荐解释生成方法
大语言模型 生成方法 化肥 文本 微调方法
3
一种基于监测图像的水稻叶片稻瘟病检测方法
检测农田 叶片 像素点 标记 色彩
4
一种基于PSO-GRU的拉索气动特性预测方法及系统
GRU模型 气动特征 拉索 特性预测方法 粒子群算法
5
一种对抗样本生成方法、系统、电子设备、存储介质
样本生成方法 注意力 生成系统 深度学习模型 通道
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号