摘要
本发明公开了一种基于自适应强化学习的四足机器人运动控制方法,该方法包括下述步骤:构建自适应模块和策略网络,生成多个仿真地形和机器人实例;获取机器人的历史状态,输入自适应模块进行模仿学习训练,输出当前时刻机器人的线速度估计、机器人每条腿的抬腿高度估计和周围地形潜在特征估计;获取自适应模块的输出以及当前机器人状态,输入策略网络进行强化学习训练,输出多个电机关节的目标角度,将目标角度转换成目标力矩;机器人执行目标力矩,根据奖励函数计算当前奖励,并更新机器人状态;将训练后的自适应模块和策略网络组成四足机器人的运动控制器,对四足机器人进行运动控制。本发明能控制机器人在复杂地形中实现稳定且敏捷的运动。
技术关键词
四足机器人
策略
网络
力矩
运动控制器
多层感知机
机器人运动控制系统
运动控制模块
深度强化学习算法
状态更新
关节编码器
机器人电机
机器人基座
仿真器
惯性传感器
命令
系统为您推荐了相关专利信息
深度卷积神经网络
图像深度信息
训练样本数据
场景深度信息
检测头
归一化水体指数
原始图像数据
预训练模型
神经网络模型
超参数
策略优化方法
订单
强化学习模型
仓库
策略优化装置