基于混合状态估计的强化学习四足机器人倒立摆稳定方法

AITNT
正文
推荐专利
基于混合状态估计的强化学习四足机器人倒立摆稳定方法
申请号:CN202411897937
申请日期:2024-12-23
公开号:CN119758719B
公开日期:2025-10-28
类型:发明专利
摘要
本发明涉及机器人与自动化技术领域,公开了一种基于深度强化学习的四足机器人倒立摆稳定控制方法,具体包括:将一阶倒立摆固定在四足机器人的机身上;将四足机器人的运动建模为部分可观测马尔可夫决策过程,并通过基于演员‑评论家模型的邻近策略优化算法对部分可观测马尔可夫决策过程输出的策略进行训练;演员‑评论家模型包括策略网络和价值网络;在策略训练过程中采用域随机化技术,随机化环境的参数;综合考虑速度跟踪奖励、稳定性惩罚以及倒立摆惩罚项来设计奖励函数,以训练价值网络并提供监督信号。本发明设计了一种端到端的、基于混合状态估计的四足机器人倒立摆稳定方法,提升了机器人平衡能力和稳定性能。
技术关键词
四足机器人 状态估计量 稳定方法 策略 长短期记忆网络 机身 编码器 参数 信息熵 稳定控制方法 状态估计器 深度强化学习 机器人关节 决策 多层感知机 计算误差 速度
系统为您推荐了相关专利信息
1
低功耗轨迹上报方法及装置
定位终端 历史运动数据 坐标 轨迹 路段
2
基于数据探索的运动路径特征分析方法与系统
航天设备 特征分析方法 路径特征 策略 导航系统数据
3
一种基于人工智能的森林火灾预测方法及系统
森林火灾预测方法 图像特征集 火灾特征 地点 长短期记忆网络
4
一种大型钢结构连廊的焊缝质量的检测方法、介质及系统
大型钢结构 焊缝 特征提取网络 特征融合网络 频率响应
5
一种功能安全硬件故障管理系统及方法
硬件故障管理系统 诊断芯片 机制 策略 MCU芯片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号