摘要
本发明属于移动机器人技术领域,具体涉及基于深度强化学习的球形多伸缩足机器人自主变形运动方法。该方法包括以下步骤:基于机器人运动特性,构建状态空间与动作空间;在仿真环境中搭建训练场景,设计包括狭窄隧道地形和随机高度障碍的非结构化地形;构建深度强化学习网络模型,包括策略网络、动作值函数网络及经验池等核心模块,并确定其网络参数;根据任务需求设计多目标奖励函数;对深度强化学习网络进行训练与优化,最终生成高效的自主变形运动策略。相较于现有技术,本发明具备更高的环境适应性与任务泛化能力,能够根据不同地形条件,自主调整变形方式,从而实现复杂地形下的高效稳定运动。
技术关键词
仿真环境
深度强化学习算法
球形
策略
非结构化地形
移动机器人技术
隧道
随机噪声
运动
训练机器人
神经网络结构
机器人关节
网络仿真
训练场景
速度
系统为您推荐了相关专利信息
深度强化学习算法
电压调节策略
有功功率
灵敏度矩阵
节点
机器人柔性关节
扩张状态观测器
位置控制方法
反馈控制器
系统动力学模型
机械助力臂
调控方法
自动化生产线
机器学习算法
物体识别定位
客流方法
动态
智能疏散引导系统
地铁站突发事件
城市轨道交通车站