摘要
本发明涉及一种双足机器人复杂地形自适应步态规划方法及双足机器人,属于机器人技术领域,包括步骤:构建分数阶PID控制器,该分数阶PID控制器包括多传感器网络模块、自适应模块和分数阶微积分控制模块;构建用于双足机器人步态规划的强化学习模型,设置强化学习的状态、动作、决策以及强化学习奖励函数,并使用策略梯度方法对强化学习模型进行持续的迭代与优化调整,更新策略参数,输出双足机器人的控制参数;通过综合损失函数对分数阶PID控制器和强化学习模型输出的控制参数进行决策融合,得到全局最优的双足机器人控制参数。本发明能够为双足机器人在复杂地形中提供更加准确的步态规划,达到更好的行走灵活性和适应性。
技术关键词
步态规划方法
强化学习模型
分数阶微积分
双足机器人步态
梯度方法
积分控制模块
多传感器
网络模块
决策
传感器节点
策略更新
机器人技术
系统为您推荐了相关专利信息
深度强化学习模型
动态界面生成方法
界面策略
界面生成系统
梯度算法
智能编排方法
异构网络资源
动态知识图谱
网络资源数据
资源分配策略
任务调度方法
强化学习模型
节点
资源
滑动平均值
强化学习模型
模型训练模块
控制智能体
强化学习方法
无监督