摘要
本发明公开了一种多机器人自主探索增强型分层规划框架,解决了现有系统在大型环境、智能体数量增多及传输带宽受限等场景下的短视性和高维学习空间收敛困难问题。提出了一种三层规划框架,结合边界方法的低维动作空间效率与深度强化学习的远视性和最优性。首先,在自由空间中确定边界,创建稀疏地图表示以减轻数据传输负担,并降低深度强化学习动作空间的维度。其次,开发多图神经网络(mGNN),纳入目标状态和机器人的状态,利用基于策略的强化学习计算亲和度,替代传统启发式效用值。最后,通过子序列搜索实现局部路由规划,避免穷举遍历。广泛验证和仿真结果证明,该框架能以更少时间步长和数据传输量实现环境探索,显示了其效率和性能的优越性。
技术关键词
规划
深度强化学习
栅格地图
匈牙利算法
计算中心
分层
序列
合并算法
神经网络模型
重构算法
聚类
机器人传感器
导航模块
机器人位姿
边界方法
框架
导航算法
全局地图
系统为您推荐了相关专利信息
建图方法
控制清洁机器人
局部路径规划
里程计
动态避障方法
卫星轨道参数
卫星探测器
开机次数
求解算法
处理器通信