摘要
本发明公开了一种基于深度强化学习的大规模车辆路径规划方法,首先分别定义全局划分策略和局部路由策略;基于图神经网络GNN构建全局划分模型;基于分层信息融合策略与注意力机制构建局部路由模型,所述分层信息融合策略包括域内注意力层与域间注意力层的协同优化;使用局部路由策略的强化学习的环境、奖励函数、状态对局部路由模型进行训练;借助训练好的局部路由模型,使用全局划分策略强化学习的环境、奖励函数、状态对全局划分模型进行训练;输入大规模路径规划问题,使用训练好的局部路由模型和训练好的全局划分模型得出路径规划结果。本发明有效的降低了路径规划需要的时间成本,提高了大规模路径规划问题的求解质量。
技术关键词
车辆路径规划方法
深度强化学习
客户
融合策略
代表
终点
强化学习环境
注意力机制
更新模型参数
矩阵
感知特征
分层
关系
线性
节点数
系统为您推荐了相关专利信息
GCN模型
超参数
节点特征
Softmax函数
矩阵
顶点特征
调控系统
神经网络模型
路边单元
车辆终端
策略
进化算法
控制机器人行走
多智能体强化学习
多智能体协作