摘要
本发明提出一种基于深度信息的人形机器人分层AI导航避障方法,上层强化学习模型将人形机器人的多种信息作为输入,并输出速度指令,使其作为下层强化学习模型的输入之一,下层强化学习模型输出各个关节的力矩并控制机器人运动,并通过估计网络对人形机器人当前的速度和角速度进行估计,在部署时与人形机器人本体信息进行融合,估计出人形机器人的实时位置,通过设置分层架构,使得人形机器人的导航避障能力可以与运动能力几乎解耦,网络也能分开训练,下层强化学习模型对速度进行了估计,估计精度很高,使在没有外部定位的情况下,也可以估计出机身的速度和位置,上层强化学习模型则是通过对视觉图像的分析,来做出速度的调整,最终实现避障。
技术关键词
人形机器人
强化学习模型
导航避障方法
网络
控制机器人运动
仿真环境
实时位置
深度图
IMU信息
分层
状态估计器
阶段
原型
速度估计
策略更新
样本
编码器
指令