摘要
本发明公开了一种基于强化学习的移动机器人路径规划方法;首先,通过设计一个双经验池分别存储正反两方面的经验,并设置从两个经验池的采样比例,以平衡探索与探索之间的关系,从而加快收敛速度;其次,通过优化排斥力的产生方向,增强了人工势场方法,并用改进后的APF方法取代Double DQN的随机探索策略,进一步加快收敛速度;最后,通过分析路径与障碍物之间的空间关系,消除多余节点,之后使用贝塞尔曲线对路径平滑处理,从而提高路径质量。本发明优化了学习网络训练过程,从而使机器人做出最优的路径规划动作。
技术关键词
神经网络权值
障碍物
三阶贝塞尔曲线
网格
移动机器人
卷积神经网络提取
节点
线段
训练神经网络
参数
人工势场
神经网络模型
仿真平台
仿真环境
冗余
规划
系统为您推荐了相关专利信息
动态区域划分
分布特征
告警系统
告警策略
风险评估模型
X光安检图像
多视角
管理方法
三维重构算法
危险品
单据生成系统
跨系统数据
构建机器学习模型
验证访问权限
密度聚类方法
综合控制方法
手术机器人
深度Q网络
模式
障碍物
坐标系
路面轮廓
路段
点云数据采集
数据构建方法