摘要
本发明提供一种基于时空注意力机制的物流配送车辆智能调度方法、系统、设备及介质,属于人工智能与物流运输技术领域,具体涉及收集快递订单集合,构建快递车辆运输网络图;构建快递车辆调度模型,设置约束条件;设计基于时空注意力机制的深度强化学习算法,进行订单的分配和车辆路线的规划;构建基于演员评论家的强化学习算法,训练目标参数网络;生成车辆路线,计算路线的奖励值和估值网络的状态价值,基于更新演员策略网络和评论家网络的参数,完成预设轮次的训练,得到目标参数网络。本发明减少了车辆行驶的总路径长度,避免了路线交叉和重复,提高了车辆的满载率和行驶速度,从而提高了快递车辆的运输效率,缩短了快递配送时间。
技术关键词
时空注意力机制
物流配送车辆
智能调度方法
深度强化学习算法
节点
网络
订单
嵌入特征
车辆路线规划
客户
策略
仓库
参数
仿真环境
空间特征信息
智能调度系统
综合评价指标