摘要
本发明涉及机器人控制方法技术领域,特别涉及一种面向仿真到现实迁移的机器人步态优化方法,包括:获取机器人的输入特征;采用近端策略优化强化学习算法构建步态控制模型;在物理仿真环境中并行训练所述步态控制模型;将所述输入特征矩阵输入训练完成的所述步态控制模型,生成关节目标位置控制指令,控制机器人执行步态动作;应用仿真到现实排查工具执行域随机化操作;根据所述差距参数调整所述仿真参数,输出优化后的所述步态控制模型参数,本发明通过应用仿真到现实排查工具执行域随机化操作覆盖现实环境不确定性,结合系统化差异定位流程,识别仿真与实机差异参数,防止仿真训练的步态策略在实机部署时出现动作畸形、稳定性差或硬件损伤。
技术关键词
机器人步态
仿真环境
强化学习算法
关节
实体机器人
物理
延迟参数
策略
矩阵
机器人连接件
多层感知机
多阶段
机器人控制方法
网络
模型训练模块
电机电枢
速度
正弦波