基于混合状态估计的强化学习四足机器人倒立摆稳定方法

正文

推荐专利

申请号：CN202411897937

申请日期：2024-12-23

公开号：CN119758719B

公开日期：2025-10-28

类型：发明专利

摘要

本发明涉及机器人与自动化技术领域，公开了一种基于深度强化学习的四足机器人倒立摆稳定控制方法，具体包括：将一阶倒立摆固定在四足机器人的机身上；将四足机器人的运动建模为部分可观测马尔可夫决策过程，并通过基于演员‑评论家模型的邻近策略优化算法对部分可观测马尔可夫决策过程输出的策略进行训练；演员‑评论家模型包括策略网络和价值网络；在策略训练过程中采用域随机化技术，随机化环境的参数；综合考虑速度跟踪奖励、稳定性惩罚以及倒立摆惩罚项来设计奖励函数，以训练价值网络并提供监督信号。本发明设计了一种端到端的、基于混合状态估计的四足机器人倒立摆稳定方法，提升了机器人平衡能力和稳定性能。

技术关键词

四足机器人状态估计量稳定方法策略长短期记忆网络机身编码器参数信息熵稳定控制方法状态估计器深度强化学习机器人关节决策多层感知机计算误差速度

系统为您推荐了相关专利信息

低功耗轨迹上报方法及装置

定位终端历史运动数据坐标轨迹路段

基于数据探索的运动路径特征分析方法与系统

航天设备特征分析方法路径特征策略导航系统数据

一种基于人工智能的森林火灾预测方法及系统

森林火灾预测方法图像特征集火灾特征地点长短期记忆网络

一种大型钢结构连廊的焊缝质量的检测方法、介质及系统

大型钢结构焊缝特征提取网络特征融合网络频率响应

一种功能安全硬件故障管理系统及方法

硬件故障管理系统诊断芯片机制策略 MCU芯片

基于混合状态估计的强化学习四足机器人倒立摆稳定方法

站点导航

APP 下载