摘要
本申请提供了一种人形机器人强化学习训练方法、装置、设备及存储介质,其中,该方法包括:获取人形机器人的模型文件;对模型文件进行解析,得到人形机器人的双脚的位置关系以及人形机器人的部件约束信息,并根据双脚的位置关系,建立基准坐标系;根据基准坐标系以及部件约束信息,构建得到人形机器人的并联踝关节机构模型,并根据并联踝关节机构模型确定逆运动学信息;根据逆运动学信息以及部件约束信息,对人形机器人的强化学习策略进行训练。本申请避免了训练过程中通过解算的方式进行串并联转换,提高了运算效率,同时,还降低了对强化学习并行采样效率的要求,简化了训练过程,加快强化学习策略的收敛速度。
技术关键词
人形机器人
踝关节机构
学习训练方法
主动臂
雅可比矩阵
强化学习策略
强化学习环境
角度目标值
逆运动学
建立基准坐标系
加速度
机器可读指令
学习训练装置
可读存储介质
关系
处理器
电子设备
系统为您推荐了相关专利信息
人形机器人
深度强化学习
机器人控制模块
决策
网络
视觉定位方法
图像匹配
前端模块
视觉定位系统
视觉里程计
轨迹优化方法
引力场模型
航天器
碰撞模型
表达式
混联机构
滑模控制算法
径向基神经网络
滑模控制器
误差向量