摘要
本发明属于机器人控制技术领域,公开了一种基于潜在动力学自适应的高齿轮比人形机器人鲁棒行走控制方法及系统,包括:设计基于深度强化学习的控制策略训练框架,采用Actor‑Critic结构和PPO算法进行优化;构建潜在动力学自适应网络LDAN,通过变分自编码器提取环境与本体动力学参数;设计多维奖励函数;利用von Mises分布和运动捕捉数据构建周期性步态库;通过课程式仿真训练逐步引入地形扰动与动力学变化;将训练完成的策略与LDAN模块部署于高齿轮比驱动的人形机器人,本发明解决了高齿轮比人形机器人在多变环境中运动稳定性差、适应性弱及动作表达不足的问题,具有鲁棒性强、自然表达性高、迁移能力强的优点。
技术关键词
行走控制方法
人形机器人
深度强化学习
网络
编码向量
编码器
控制策略
运动捕捉数据
关节
仿真环境
动作重定向方法
周期性
解码器
逆运动学
人体动作数据
重构误差
机器人传感器