一种双足机器人步态网络训练方法

正文

推荐专利

一种双足机器人步态网络训练方法

申请号：CN202511238850

申请日期：2025-09-01

公开号：CN120722767B

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种双足机器人步态网络训练方法，构建双通道深度强化学习架构；采集X个双足机器人在仿真环境的简单地形中的运行状态；根据当前运行状态得到当前奖励，并将各信息合并马尔可夫决策过程存入经验回放区；当经验回放区中的马尔可夫决策过程数目大于预设阈值n，从中随机取预设数量的马尔可夫决策过程，更新主网络和对手网络参数；对主网络参数实施扰动，并模拟人类记忆曲线对主网络超参数clip进行持续性调整；将稳定行走时长达到预设时长的双足机器人移至难度等级更高的地形，重复各网络参数更新过程；不断进行课程学习，直至所有双足机器人的累计奖励信息及稳定行走时长均达到预设值。

技术关键词

双足机器人步态网络训练方法策略仿真环境深度强化学习超参数生成电机课程学习方法决策网络结构生成控制指令机器人控制多层感知器样本运动跟踪

系统为您推荐了相关专利信息

用于线束生产车间的可视化管理系统及方法

可视化管理方法白名单可视化管理系统热力图人机

AGV车辆分段制动检测控制方法及其相关设备

障碍物检测控制方法制动控制模块车辆融合算法

一种分布式计算机的集成化管理系统

集成化管理系统分布式计算机负载均衡模块博弈论模型节点

基于自适应多边形逼近与多特征感知的雾化参数计算方法

参数计算方法雾化图像多边形初始轮廓关键特征点

一种基于改进灰狼优化器的电动汽车充电站选址定容方法

充电站选址定容灰狼优化算法位置更新非线性优化器

一种双足机器人步态网络训练方法

站点导航

APP 下载