摘要
本发明公开了一种基于深度强化学习的数据中心系统任务调度方法,通过将任务分解为选择和调度两个子任务,显著降低了动作空间的维度,并设计了分层即时奖励机制,避免了稀疏奖励的弊端。每个子任务具有独立的奖励机制,选择奖励和调度奖励相互联动,共同优化调度效率。实验结果表明,本发明所提出的方法表现优于现有的其它数据中心系统任务调度方法,有效降低了任务的平均运行时间和完成时间。
技术关键词
数据中心系统
智能体模型
任务调度方法
决策
SAC算法
队列
深度强化学习模型
调度系统
主机特征
延迟矩阵
策略
资源特征
一台主机
机制
系统为您推荐了相关专利信息
视频分析
系统状态信息
网络状态信息
满意度函数
决策
定位终端
决策树模型
定位方法
节点
信号强度信息
多模态特征
无创筛查系统
时空融合特征
筛查方法
眼动轨迹
热轧工艺
设备工况
构建决策树
标签化数据
自动化控制系统