摘要
本发明公布了基于改进DQN算法的路径规划方法,路径规划方法的目的是选择无碰撞路径到达理想位置。路径规划要解决到达目标、绕开障碍等问题,传统方法需预设环境地图。深度强化学习用于解决动态路径规划问题,常见路径规划方法分离线和在线。DRL通过试错与环境交互学习最优策略,DQN算法在路径规划中有应用但存在收敛慢等问题。本发明提出改进的DQN路径规划算法及系统,通过改进奖励函数、动作选择策略,引入先验知识和优先经验重放解决问题。包括构建二维栅格网络环境地图,基于此和马尔可夫决策过程构建并改进优化DQN路径规划模型,改进策略涵盖奖励塑造、设计衰减的ε‑greedy策略、引入先验知识和优先经验重放。
技术关键词
路径规划方法
DQN算法
方格
障碍物
采样率
动态路径规划
地图
路径规划算法
模拟退火算法
栅格
深度强化学习
规避系统
代表
贪婪策略
数据
阶段
无碰撞
网络
系统为您推荐了相关专利信息
地图模型
误差信息
计算机程序产品
定位方法
对象
移动机器人
DWA算法
全向
避障路径
麦克纳姆轮小车
路径规划方法
路径规划单元
管道
启发式搜索
实体