摘要
本发明公开了一种基于带感知深度强化学习的四足机器人运动控制方法,将四足机器人速度跟踪优化目标改进为点到点的距离最小化优化目标,并与三维环境感知网络结合;三维环境感知网络使用多层、多分辨率的环境扫描信息作为特权信息输入到教师策略网络,根据基于位置的多目标奖励机制计算损失,对教师策略网络进行优化;使用四足机器人机载的深度信息作为学生网络的输入,使用模仿学习的方式训练自适应模块和学生网络;根据四足机器人在九种不同的参数化地形中的表现,计算地形完成分数,根据所得分数提升地形难度或降低地形难度。上述方法具有更强的运动能力,能使四足机器人在各种困难地形中完成跑酷越障任务,且计算复杂度低、受误差影响小。
技术关键词
四足机器人
机器人运动控制方法
三维环境感知
教师
深度强化学习
信息编码器
策略
关节
学生
代表
多层感知器网络
多分辨率
采样点
崎岖地面
模块
参数
系统为您推荐了相关专利信息
移动式充电桩
充电站
调控策略
GAN模型
控制系统
轨迹规划方法
多无人机
地面
频分多址方式
多智能体模型
高铁受电弓
智能监测系统
预警模型
决策
深度强化学习技术
深度强化学习模型
图像
参数
计算机程序产品
表达式