摘要
本发明属于机器人控制技术领域,具体涉及一种基于深度强化学习的机器人路径规划方法及装置。本发明的路径规划方法由机器人仿真模型对路径规划算法进行训练得到,训练过程中重复循环如下训练步骤:在机器人仿真模型运行过程中,所述路径规划算法获取机器人仿真模型的状态,并计算该状态下机器人仿真模型需要执行的动作,机器人仿真模型的运动控制函数控制机器人仿真模型在设定的时间内执行该动作;待机器人仿真模型停止运行后,根据运行数据对路径规划算法中的网络参数进行更新。保证了机器人仿真模型和路径规划算法的同步运行,缩短了路径规划算法运行的时间,大幅提高了训练结果的收敛速度和稳定性,提升了路径规划算法的控制效果。
技术关键词
机器人仿真
路径规划算法
深度强化学习
路径规划方法
机器人路径规划
机器人控制技术
三维坐标信息
机器人位姿
网络结构
模块
速度
存储器
处理器
运动
参数
系统为您推荐了相关专利信息
位置追踪功能
创建虚拟导览
机器学习算法分析
识别用户兴趣
路径规划设计
耐高温合金
铜合金粉末
微通道冷却结构
发动机风扇
发动机主体