一种深度学习训练集群调度方法、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202510994809

申请日期：2025-07-18

公开号：CN120508399B

公开日期：2025-09-12

类型：发明专利

摘要

本发明提供一种深度学习训练集群调度方法、设备及计算机可读存储介质，所述集群调度方法包括：收集深度学习训练任务相关数据；构建有效的多配置深度学习训练任务时长预估模型，并对其进行增量式训练；对集群陆续到达的任务进行时长预测，以生成深度学习任务多配置下的任务时长；将基于预测结果的周期性调度和基于任务队列状态的触发式调度结果相结合，集成综合调度结果。本发明所述深度学习训练集群调度方法一方面能够有效解决现有深度学习训练集群调度技术存在的多种配置下的任务时长难以预估，调度方案忽视CPU以及难以应对持续到达的任务等缺陷；另一方面可实现对深度学习训练集群的合理调度，提高集群资源利用率，优化任务执行效率等。

技术关键词

深度学习训练任务集群调度方法深度学习模型核心时间预测模型外推模型调度器生成深度学习周期性启发式方法阶段基准数据随机森林集群资源利用率集群调度技术调度设备

系统为您推荐了相关专利信息

一种基于深度学习的输电线路与间隔棒的图像分割方法

图像分割方法深度学习模型线路编码器像素

摊位识别检测方法、装置和电子设备

识别检测方法视频帧摄像设备深度学习模型训练识别检测装置

用于筛选癌症患者检测的医疗数据中核心特征的系统

皮尔逊相关系数患者核心数据采集模块编码

一种冲压件表面缺陷检测方法

环境光表面缺陷检测方法编码向量冲压件时序

一种输电线路状态监测方法、装置及介质

图像边缘检测绝缘子轮廓轮廓图像深度学习模型导线

一种深度学习训练集群调度方法、设备及计算机可读存储介质

站点导航

APP 下载