摘要
本发明公开了基于时空二维分割与智能共享的大模型并行任务调度方法,具体提出了一种基于时空二维的模型分割策略,基于训练和推理两类任务在计算性质上的显著差异,分别采用了针对性的优化策略,提高了任务执行效率;还提出了一种基于异构资源和干扰模型的模型放置策略,解决传统方法缺乏智能共享判断,无法动态调整的缺点,提高了调度的灵活性和适应性,从而保证共享资源的最大收益。本发明解决了现有异构智算集群的调度方法在处理大模型训练和推理任务时,未能充分利用模型分割和异构资源适配的模型放置优化技术、缺乏对集群中的计算资源进行智能共享调度,从而造成的系统任务调度不合理,计算资源利用率低等问题。
技术关键词
并行任务调度方法
动态规划算法
策略
阶段
全局最小代价
集群
组合模块
分割方法
搜索算法
资源分配
调度器
节点
异构
流水线
通信量
执行器