摘要
本发明提供了一种搜救机器人群组协同任务分配和路径规划方法及系统,该方法包括:根据搜救机器人群组系统任务对应的任务要求以及当前环境信息构建全局乘积马尔可夫决策过程模型;基于MDP模型,循环选择机器人,并使用改进Q‑learning算法求解每个机器人在局部MDP模型的最优策略;控制选择的机器人按照最优策略进行移动,更新机器人每移动一步的环境估计权重,并对各机器人的环境估计结果进行融合;根据环境融合结果更新全局乘积MDP,并判断是否进入全局乘积MDP的最终状态,若进入则停止计算;否则返回,最终状态为所有机器人均完成其搜救任务以及实现过程中的全部位置更新;以克服现有技术的不足,有效提升搜救机器人在实际任务环境中的适用性的技术问题。
技术关键词
搜救机器人
路径规划方法
加权融合算法
动作策略
机器人系统
位置更新
路径规划系统
决策
短距离
矩阵
轨迹
处理器
计算机设备
输出模块
列表
存储器