摘要
本申请公开了一种大模型训推任务调度方法、装置、设备及存储介质,涉及信息处理技术领域,包括:获取模型推理任务对应的推理任务信息以及模型训练任务对应的训练任务信息;基于推理任务信息以及训练任务信息,确定模型推理任务对应的第一任务执行位置以及第一任务调度时间与模型训练任务信息对应的第二任务执行位置以及第二任务调度时间;基于第一任务执行位置、第一任务调度时间、第二任务执行位置以及第二任务调度时间,对模型推理任务以及模型训练任务进行任务调度。本申请能够实现灵活、准确且及时的大模型训推任务调度,以解决大模型推理任务因需要加载超大模型文件等情况导致耗时较长,进而无法快速完成训练任务到推理任务切换的问题。
技术关键词
任务调度方法
任务调度设备
时间预测模型
任务调度装置
信息处理技术
标识
快照
处理器
资源库
指标
可读存储介质
存储器
动态
模块
计算机