摘要
本申请公开了一种物流场景资源调度方法、系统、电子设备及存储介质,方法包括:获取预设作业信息;根据所述预设作业信息通过列约束生成算法预测得到期望作业位分配结果;根据所述期望作业位分配结果和预设装卸信息通过预设深度强化学习模型预测得到期望载具调度结果;其中,所述预设深度强化学习模型由深度Q网络算法和概率策略优化算法构建得到;当确定所述期望载具调度结果和所述期望作业位分配结果满足预设成本条件,根据所述期望载具调度结果和所述期望作业位分配结果确定目标调度分配结果。本申请实施例能够有效提高物流场景资源调度在复杂扰动场景下的系统稳定性与运行效率。本申请可以广泛应用于物流自动化与资源调度技术领域。
技术关键词
深度强化学习模型
混合整数规划模型
深度Q网络
策略
资源调度方法
鲁棒优化算法
生成算法
场景
资源调度技术
物流
资源调度系统
数据
电子设备
可读存储介质
处理器
搜索算法
参数
模块
计算机
系统为您推荐了相关专利信息
风险评估模型
轨道交通运输系统
专业
风险评估方法
初始运行状态
MEC系统
车联网系统
最小化系统
车辆网系统
服务器
实体对齐方法
无监督学习
字符
视觉特征
文本挖掘方法