摘要
本发明公开了一种基于深度强化学习的成本感知工作流任务调度方法,包括以下步骤:步骤(1):构建工作流任务时延模型,步骤(2):构建工作流任务成本模型;步骤(3):计算获取工作流任务嵌入;步骤(4):构建深度强化学习任务调度环境;步骤(5):构建任务调度决策网络,该网络通过当前的任务调度环境以及工作流任务嵌入,以奖励函数训练迭代任务调度决策网络直至迭代完成。本发明采用图神经网络获取任务嵌入,从而表征工作流任务的高维特征;本发明优化了动作选择策略和优先级经验回放策略,CA‑DRL能够根据任务特性动态优化任务的执行位置,使模型在任务延时与成本目标之间实现更有效的平衡,进而实现高效且经济的任务调度性能。
技术关键词
深度强化学习
任务调度
决策
注意力神经网络
双网络架构
时延
SMD设备
服务器
调度工作流
边缘计算环境
指数衰减函数
分支
在线
参数
节点
拓扑特征
策略
系统为您推荐了相关专利信息
资源
功率
核密度估计模型
多面体
非参数核密度估计
通信节点
服务质量参数
多模通信终端
多模通信网络
决策
决策支持模型
资源弹性分配策略
智能化管理系统
虚拟机实例
度量
运输控制方法
物体
系统状态信息
周期性
双机器人