摘要
本发明公开了一种全自动足式机器人实物在线强化学习训练系统及方法,系统包括重置机构、在线强化学习网络、数据采集系统和重置判断系统,机器人部署在重置机构中,重置机构和机器人接入在线强化学习网络;数据采集系统用于在机器人执行动作进行运动训练时,采集机器人的训练数据;在线强化学习网络用于根据上一时刻器人的训练数据计算机器人当前时刻的待执行动作,以使机器人根据待执行动作进行运动训练;重置判断系统用于根据机器人每次执行动作进行运动的训练数据判断机器人位置是否需要重置;重置机构用于在重置判断系统确定需要重置时,将机器人移动至初始位置重新开始下一轮训练。
技术关键词
学习训练装置
足式机器人
重置机构
强化学习网络
数据采集系统
判断系统
在线
运动训练
学习训练系统
学习训练方法
机器人本体
数据处理模块
电机传感器
监测模块
关节
姿态传感器
监测传感器
传感器组
系统为您推荐了相关专利信息
钻进参数
凿岩台车
神经网络预测模型
数据采集系统
自动优化方法
神经架构搜索
强化学习算法
神经网络结构
搜索算法
策略
植被
数据采集方法
数据样本集合
压缩特征
三维环境感知
人工智能分析系统
燃气轮机
数据采集传感器
数据存储系统
数据采集系统
收银机
数据采集系统
存储模块
无线连接方式
图片