摘要
本发明提出一种高度受限环境下基于分层强化学习的蛇形机器人控制方法,具体包括:搭建高度受限的复杂地形仿真场景,明确要执行的任务;建立蛇形机器人仿真模型,对蛇形机器人的结构、关节及动力学参数进行建模;基于多层感知机设计包括高层策略网络和低层策略网络的分层控制结构,分别用于生成全局导航子目标和具体动作控制;并定义状态空间、动作空间和奖励函数;在训练阶段采用PPO算法对高低层策略分别进行优化,通过仿真环境反复试验,利用奖励函数引导策略收敛,最终实现机器人仅依赖其自身运动状态与获悉目标位置,完成路径规划与运动控制。本发明实现了蛇形机器人的自主导航和避障,增强了其环境适应性。
技术关键词
蛇形机器人
分层强化学习
分层控制结构
多层感知机
网络
受限
仿真场景
控制机器人关节
策略更新
仿真环境
仿真模型
角速度传感器
障碍物
节点数
立方体
控制力矩
旋转关节