摘要
本发明提供了一种基于强化学习的水下六足机器人多壁面连续运动控制方法,利用测距设备来获取水下六足机器人质心到待攀爬壁面的前向距离,同时利用测距设备获取水下六足机器人质心与水下六足机器人当前所处壁面的距离;通过分析定速定向攀爬及壁面跨越任务,设定状态空间、动作空间以及面向平稳跨越及定速定向攀爬任务的奖励函数;利用深度确定性策略梯度的强化学习方法,训练出在不同倾角壁面间平稳跨越的步态。本发明避免了传统步态规划方法建模复杂、步态切换不稳定的问题,使得水下六足机器人能够在不同倾角壁面间跨越和沿不同倾角壁面定向定速攀爬的任务,同时可求解与刀锋腿转矩相适应的推进器推力,保证水下六足机器人运动稳定性。
技术关键词
六足机器人
运动控制方法
推进器
壁面
测距设备
强化学习方法
推力
机器人本体
水下机器人
步态规划方法
作用力
网络
多普勒测速仪
力矩
关节
坐标系
策略
地点
系统为您推荐了相关专利信息
关节
运动控制方法
移动机器人
滑模控制律
雅可比矩阵
超临界水气化
模型预测控制器
仿真模型
变量
平推流反应器
隧道变形监测方法
爬壁机器人
远程监控中心
隧道超前地质预报技术
隧道壁面
声波传感器
流体流动通道
声波传播路径
流速
模型算法