摘要
本发明提供了一种基于深度强化学习的土方施工动态调度方法、设备和存储介质,方法包括:获取施工信息,确定约束条件和施工设备的集成调度目标,设定目标函数;将施工设备的集成调度问题表述为马尔科夫动态决策过程,生成第一智能体;基于NSGA‑Ⅱ和DDQN算法设计奖励函数对第一智能体进行训练;生成初始调度方案,并基于该方案执行虚拟调度;基于假设的扰动事件补充约束条件,通过马尔科夫动态决策过程生成第二智能体;对初始调度方案中的作业进行区分,根据区分结果设计NSGA‑Ⅱ算法的编码和解码方法;基于设计编解码后的NSGA‑Ⅱ算法和DDQN算法设计奖励函数对第二智能体进行训练;将训练稳定后的智能体部署在实际施工环境中,生成动态调度决策。
技术关键词
施工设备
动态调度方法
深度强化学习
分区
算法
解码方法
编解码
分层
阶段
决策
序列
后续作业
网络
编码
指令
计算机设备
可读存储介质
存储器
系统为您推荐了相关专利信息
纺织定型机
节能控制系统
深度学习优化
能量存储模块
电化学存储设备
广告推送方法
LRU算法
序列
风格
构建用户画像
缺陷识别方法
港口起重机
卡尔曼滤波算法
视觉
钢丝绳表面缺陷
吸力锚
拉力传感器
输入输出关系
直线式伺服电动缸
随机森林模型