摘要
本发明公开了一种基于安全强化学习的云资源动态调度方法,包括:将每个应用需求抽象为一个有向无环图,每一个作业阶段用节点表示,每一条边表示作业阶段之间的数据依赖;将计算资源的动态调度问题建模为马尔科夫决策过程,构建强化学习策略模型,定义状态、动作和奖励;强化学习策略模型包含图神经网络和决策网络,决策网络接收图神经网络的输出,并生成选择调度的任务节点和资源分配上限;以奖励最大化为目标对强化学习策略模型进行训练;训练完成后,对于当前时间步,结合实时获取的计算集群的状态,按顺序计算每一个决策步要调度的任务节点和实际分配的计算资源。利用本发明,可以实现更高效的资源调度,提高了计算资源的利用效率。
技术关键词
资源动态调度方法
强化学习策略
有向无环图
节点
决策
资源分配
网络
阶段
强化学习算法
非线性
集群
定义
层级
广义
矫正
数据
因子
系统为您推荐了相关专利信息
电力系统故障
线路
故障定位模型
变量
分布式电源
混合整数规划模型
分布式发电机
节点
有功功率
Stackelberg博弈模型
药物递送系统
痤疮
皮肤生理参数
多模态
深度学习图像识别
视觉特征
空间拓扑关系
多通道特征
语义
对象识别