摘要
本公开提供了一种多移动机器人分层强化学习运动规划方法与系统,属于机器人及群智能技术领域。该方法构建双层规划器;上层规划器和下层规划器均采用神经网络模型进行动作规划,且通过强化学习进行训练。上层规划器根据局部地图信息和机器人自身物理信息,产生连续时空中机器人的速度作为全局指引速度,传递给下层规划器。下层规划器以最优互惠避障ORCA观测和机器人自身观测作为下层观测,同时以上层规划器提供的全局指引速度作为目标速度,产生机器人动作规划结果。使用本发明能够解决真实室内非结构化环境的多机器人运动规划问题。
技术关键词
策略网络模型
分层强化学习
运动规划方法
移动机器人
速度
运动规划系统
空中机器人
神经网络模型
更新网络参数
邻居
递归神经网络
机器人运动规划
地图
非结构化环境
定义
样本
算法
系统为您推荐了相关专利信息
传感器布设方法
受力状态监测
导管架
监测点
杆件
动作检测方法
空中无人机
检测无人机
协方差矩阵
记忆
风险预测模型
模式特征向量
活动状态分类
分层特征提取
智能监测方法
多肽
纳米酶
硼氢化钠
淋巴瘤动物模型
急性髓细胞白血病