摘要
本发明提供了一种基于深度强化学习的容器云任务调度方法,包括:定义容器云任务调度事项;建模为马尔可夫决策模型,包括:以每个任务的任务需求和每个可用节点的当前资源状态作为状态集,将可用节点的集合作为动作集;智能体根据任务的任务需求、可用节点的当前资源状态和任务调度策略,将任务分别调度给某个可用节点;定义奖励函数,用于在智能体将任务调度到可用节点后计算奖励;通过深度强化学习模型对马尔可夫决策模型进行优化,得到优化后的任务调度策略。本发明还提供一种基于深度强化学习的容器云任务调度装置、存储介质及电子设备。借此,本发明能够从系统的运行信息中自动学习到预期的调度策略,自动适应变化的环境,而无需依赖专家知识。
技术关键词
任务调度策略
云任务调度方法
深度强化学习模型
定义
容器
任务调度装置
资源
决策
集群
因子
深度Q网络
深度神经网络
索引
处理器
节点特征
代表
电子设备
系统为您推荐了相关专利信息
运维管理方法
手持终端
馈线终端设备
无线通信方式
数据处理模块
联邦学习激励方法
云服务器
数据处理模块
列表
非对称加密算法
定位方法
二维高斯模型
像素点
二值化图像
原始图像数据
动态资源调度方法
水下机器人
编码
资源调度技术
染色体