摘要
本发明针对车辆路径问题领域,具体涉及一种基于深度强化学习的考虑同时送取货和时间窗车辆路径问题(VRPSDPTW)求解方法。方法步骤为:1)建立目标函数,构建考虑时间窗和同时送取货的路径问题数学模型,并确定模型约束条件;2)根据所述数学模型搭建强化学习环境;3)根据所述强化学习环境搭建基于注意力机制的神经网络模型;4)使用数据集和深度强化学习算法对构建的神经网络模型进行训练,得到效果符合要求的应用模型,并用于求解物流配送场景,输出配送方案。本发明设计的深度强化学习算法在训练后能够在不同规模尤其是大规模的车辆路径问题求解实例上表现出良好的求解质量和速度。
技术关键词
强化学习环境
深度强化学习算法
神经网络模型
数学模型
节点
编解码结构
车辆
深度强化学习模型
策略
多头注意力机制
客户
训练算法
仓库
参数
场景
模块
系统为您推荐了相关专利信息
轴承健康
融合特征
生成电动机
递归神经网络模型
状态监测方法
并行执行方法
集群
资源分配策略
多组件
深度强化学习模型
智能家居语音
交互测试方法
特异
网络结构
空间位置关系