摘要
本发明涉及基于深度强化学习的两阶段工作流调度方法和系统,属于深度强化学习技术领域。包括:1)根据用户提供的工作流和数据传输信息,构建工作流池,并初始化每个工作流的状态和任务数量;2)利用TD2QN算法循环遍历每个工作流,并将入口任务加入到就绪队列中;将进入到就绪任务队列中的任务,利用TD2QN算法进行动态地选择,并为任务分配适当的计算资源,从而最大化整个工作流的效率和性能;3)当工作流成功完成时,生成并返回有关已完成工作流的详细信息,为用户提供全面的调度结果和性能评估。本发明综合考虑成本和通信时间,提高了系统效率和性能。
技术关键词
工作流调度方法
资源调度模型
阶段
特征值
深度Q网络
工作流调度系统
深度强化学习技术
队列
依赖特征
定义
残差网络
资源分配模块
资源分配策略
神经网络参数
关系
动态地
系统为您推荐了相关专利信息
电伴热系统
RBF神经网络
GRU神经网络
集肤效应
多时间尺度