摘要
本发明公开了一种基于强化学习的蛇形机器人控制方法,包括:搭建包含墙壁、立方体障碍物和低矮通道的复杂地形仿真场景;对蛇形机器人的结构、关节及动力学参数进行建模,得到蛇形机器人仿真模型;定义蛇形机器人的状态空间和动作空间,并设计多元化的奖励函数;采用多层感知器MLP结构构建动作网络和价值网络;应用强化学习算法对蛇形机器人进行多轮仿真训练,使机器人学到不同情景下做出优化决策的参数集,实现蛇形机器人的优化控制,到达目标点。本发明无需依赖视觉信息,能够通过自主学习实现蛇形机器人在复杂环境中高效、稳定运动控制,提升在低矮狭窄空间的穿越能力。
技术关键词
蛇形机器人
强化学习算法
关节
障碍物
仿真场景
概率密度函数
稳定运动控制
多层感知器
立方体
仿真模型
通道
参数
策略更新
网络优化
仿真环境
墙壁
速度
系统为您推荐了相关专利信息
网格
误差补偿方法
工业机器人
样本
误差补偿系统
运送装置
路径规划方法
风力发电机组
路径规划装置
路径规划效率
药物筛选系统
射频识别传感器
开盖器
微孔板
培养箱