摘要
本发明涉及一种基于分层强化学习的物流车辆路径与装箱混合规划方法,属于物流管理技术领域。在给定需要运输的订单条件下,获取使最终运输成本最低的配送路径以及对应的车辆装箱方案。在物流规划过程中,需要解决车辆路径规划问题和车辆装箱问题,而物流配送中装载方案和路径规划存在耦合问题,需要同时考虑。方法利用分层强化学习的原理,将物流规划这一马尔可夫决策过程MDP提取拆分为若干个半马尔可夫决策过程SMDP作为子任务,通过任务分解对物流规划问题实行降维处理后进行分层训练。通过本分层强化学习训练所得模型,可以与物流方案在线规划系统结合,实现物流规划方案的在线决策生成。
技术关键词
分层强化学习
物流规划方法
强化学习模型
节点
规划系统
决策系统
车辆路径规划
在线
物流管理技术
客户
订单
生成方法
定义
数据
基础
系统为您推荐了相关专利信息
采集监测系统
能源
能耗特征
燃料供应管线
大数据
仿真方法
反演模型
演化特征
加速度
线性变换矩阵