摘要
本发明涉及数据中心能源管理技术领域,具体涉及一种不确定环境下的数据中心任务调度方法及系统;本发明方法包括基于马尔可夫决策过程对数据中心的任务调度过程进行建模,得到任务调度模型,在任务调度模型中,任务的信息和电价作为不确定参数,采用分位数回归强化学习算法,选择任务调度动作,计算数据中心执行该任务后的奖励,将执行该任务后的状态、任务调度动作、奖励和下一状态存储在回放缓冲区中,从而得到不同任务调度分布策略数据,以长期累积折现奖励最大化,确定任务调度模型的任务调度最优分布策略;通过本发明方法可以实现不确定性感知的任务调度策略,可以有效提高数据中心的利润和完成率。
技术关键词
任务调度模型
任务调度方法
强化学习算法
服务器
任务调度系统
数据中心能源管理
累积分布函数
分布式强化学习
任务调度策略
时序
资源
网络
因子
能耗
决策