摘要
本发明公开了一种专家学习和强化学习结合的四足机器人运动控制方法,其特征在于,包括:在仿真环境中,设置若干个仿真四足机器人,第一智能体控制仿真四足机器人进行强化学习算法迭代训练,获取第一智能体的策略参数为第一最佳参数;控制测试四足机器人运动,获取测试四足机器人的测试参数;第二智能体控制仿真四足机器人进行强化学习算法迭代训练,获取第二智能体的策略参数为第二最佳参数,第二最佳参数用于指导实体四足机器人运动控制器。采用强化学习和专家学习的结合方式,实现了全流程的自我迭代训练,去除人类可能产生的一些偏见,从而加速了训练迭代过程,提高四足机器人控制决策的公平性与可靠性。
技术关键词
四足机器人
强化学习算法
参数
生成运动轨迹
仿真环境
策略
状态观测器
凹凸路面
跨越障碍
误差
测试模块
机身
低附路面
关节力矩
实体
物理
系统为您推荐了相关专利信息
碳纤维板材
电机驱动单元
多模态数据采集
动态预测模型
参数
系统优化方法
磁耦合谐振装置
电励磁同步电机
励磁绕组
系统优化设计方法
飞机复合材料
仿真方法
分析系统
层合板结构
三明治结构整体
水质监测系统
模型构建方法
指标
布谷鸟搜索算法
参数