摘要
本申请公开了一种深度学习工作负载的调度方法、装置及电子设备。其中,该方法包括:确定待调度深度学习工作负载集群,以及运行待调度深度学习工作负载集群中的多个待调度深度学习工作负载的算力设备集合;确定待调度深度学习工作负载集群对应的多个分配方案,其中,每个分配方案指示一种调度策略;将多个分配方案中总并置干扰值最小的分配方案确定为待调度深度学习工作负载集群的调度结果,其中,每个分配方案的总并置干扰值至少依据分配方案中所有待调度深度学习工作负载的并置干扰值确定。本申请解决了因深度学习工作负载的并置引起深度学习工作负载运行过程中的相互干扰,导致运行性能下降的技术问题。
技术关键词
阶段
非易失性存储介质
集群
元素
模型超参数
策略
电子设备
关系
计算机程序产品
调度装置
节点
处理器
资源
存储器
模块
指令
系统为您推荐了相关专利信息
科技文献推荐方法
大语言模型
静态特征
论文
意图
集群拓扑图
流量变化曲线
监控方法
分发策略
节点