摘要
本发明公开了一种基于深度强化学习的全局‑局部协作轨迹规划方法,该方法包括如下步骤:开始运动,前进步数小于200时随机选择是否进行重规划和dwa的动态权重参数。步数大于200后将S传入evaluate network选择当前的动作。选择完动作后再环境中前进一步得出下一步的状态S’。根据S和S’可以计算出R值,再将[S,A,R,S’]存入记忆库。从记忆库中抽取[S,A,R,S’]训练,每5步学习一次。本发明通过深度强化学习构建了一个自主策略空间、突破了传统A*算法的静态环境假设,并进行了多目标协同优化、并进行多目标协同优化,形成应对巨大未知障碍的全局再规划决策能力,显著提高路径平滑性和环境动态适应性。实验结果表明,本发明提高了大型障碍物周围的路径平滑度,并缩短了路径长度。
技术关键词
轨迹规划方法
深度强化学习
动态障碍物
连线
记忆
机器人路径规划
静态障碍物
决策
平滑度
参数
冗余
网络
数值
算法
运动
方格
系统为您推荐了相关专利信息
工业互联网平台
故障诊断模块
构建知识图谱
决策
智能分析模型
线束导通测试
记忆
卷积神经网络模型
导通测试模块
回路