摘要
本发明属于机器人控制技术领域,具体涉及一种基于足迹规划的人形机器人运动控制方法,先构建策略网络,包括输入层、两个串联的循环隐藏层以及线性输出层;再设计奖励函数;然后基于奖励函数使用mujoco仿真平台对构建的策略网络进行训练,初始化机器人姿态与地形,不同的地形均预设有不同的脚步序列;利用PPO算法更新策略网络;利用训练好的策略网络进行人形机器运动控制。本发明在已知目标脚步序列的条件下,通过策略网络与滑动窗口观测机制实现跨地形的稳定行走,实现了从环境理解到动作生成的闭环控制;设计的奖励函数能有效引导机器人形成稳定自然的步态行为,训练好的策略网络可直接迁移到实际机器人平台。
技术关键词
运动控制方法
人形机器人
机器运动控制
策略
网络
规划
仿真平台
机器人控制技术
机器人躯干
机器人腿部
机器人平台
引导机器人
髋关节
阶段
膝关节
驱动关节
机器人本体