摘要
本发明公开了一种基于改进集成强化学习的车辆路径规划智能算法,具体包括如下步骤:步骤一、构建仿真环境;步骤二、构建马尔科夫决策模型;步骤三、采用Maxmean‑DQN算法求解最优路径,获得车辆路径规划的一个最优策略;Maxmean‑DQN算法能高效快速实现对复杂环境下的车辆路径规划,能避免车辆撞到障碍物、有效规避重复路线,解决现有路径规划中的搜索不彻底、重复已有路线、效率低的问题,实现自适应的最优路径规划;并在马尔科夫决策模型的奖赏函数中设置撞到障碍物、重复已有路线作为惩罚,尤其是设置撞到障碍物获得较大的惩罚,以避免损失。
技术关键词
车辆路径规划
DQN算法
仿真环境
智能算法
障碍物
决策
终点
网络
策略
因子
速率
参数