一种能耗感知的分布式深度学习任务调度方法及系统

正文

推荐专利

申请号：CN202511000696

申请日期：2025-07-21

公开号：CN120994365A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种能耗感知的分布式深度学习任务调度方法及系统。本发明首先获取待调度深度学习任务的任务特征信息；然后基于任务特征信息，利用预先构建的能耗预测模型，预测深度学习任务在不同GPU数量下并行训练时的能耗，并确定能耗最优的GPU数量；最后根据能耗最优的GPU数量，将深度学习任务调度至具有足够空闲GPU资源的计算节点，并为任务分配对应数量的GPU进行并行训练；在训练过程中，动态调整GPU的功率限制，以优化训练能耗。本发明通过预测分布式深度学习模型能耗最优的GPU数量，并在作业部署之后通过动态调正GPU功率限制的方法有效降低了在GPU服务器集群中训练分布式深度学习模型的整体能耗。

技术关键词

分布式深度学习任务调度方法深度学习任务调度能耗预测模型状态监控模块功率节点任务调度系统日志策略服务器集群机器学习模型动态队列搜索方法先进先出资源

系统为您推荐了相关专利信息

基于BIM的医疗设备能耗预测模型构建方法

能耗预测模型医疗设备时序节点序列

基于GANs的建筑能耗预测方法及装置

建筑能耗预测方法能耗预测模型数据引入注意力机制存储程序指令

一种超高速公路纯电动汽车能耗预测与最优路径规划方法及装置

路径规划方法纯电动汽车能耗预测模型车辆传感器数据非线性回归模型

车辆碳排放确定方法和装置、存储介质及电子设备

能耗预测模型轨迹车辆电子设备样本

一种关于百级净化车间FFU节能监测系统及其控制方法

能耗预测模型净化车间节能监测系统噪声参数监测模块

一种能耗感知的分布式深度学习任务调度方法及系统

站点导航

APP 下载