摘要
本发明涉及一种实验任务自动化调度方法,首先构建包括图神经网络与策略价值网络的深度神经网络,并对参数随机初始化;采用深度神经网络代替蒙特卡洛树搜索(MCTS)算法中选择、扩展及模拟过程;将待调度任务构建为有向无环图并输入调度模型,执行融合深度神经网络的MCTS生成决策标签;采用标签对深度神经网络进行训练,优化目标为:在相同任务状态下使策略价值网络的动作选择概率分布与MCTS的动作选择概率分布的相似度最大,且使价值估计与MCTS的完整任务调度时间的差值最小;交替执行MCTS生成标签与神经网络训练优化,将MCTS与与训练完成的神经网络组合得到最终调度模型。本发明能够在高动态性、柔性环境、易死锁的实验室复杂任务场景下完成高质量调度。
技术关键词
自动化调度方法
任务调度
节点
融合深度神经网络
蒙特卡洛树搜索
神经网络参数
神经网络训练
决策
序列
电子设备
生成标签
存储器
处理器
搜索算法
中子
系统为您推荐了相关专利信息
参数标定方法
俯仰关节
小连杆
激光跟踪仪靶球
平移方法
模型训练方法
资源调度策略
节点
复杂度
服务等级协议