摘要
本发明公开了一种基于强化学习的多机器人协同围陷方法及系统,涉及机器人协同控制技术领域。该方法包括步骤:根据目标围陷任务建立多机器人的围陷任务模型,追捕机器人对目标机器人进行围陷,利用可达安全区域量化目标机器人的受限制程度;基于聚类算法,对围陷任务模型中的追捕机器人进行自适应动态分组;基于追捕机器人的分组情况,利用多机器人围陷决策网络对环境观测信息进行挖掘,根据环境观测信息优化追捕机器人的动作决策。本发明结合自适应分组机制、策略网络优化设计等技术手段,实现高效、稳定且智能的围陷决策构建,能够显著提升多机器人系统在复杂环境下的任务执行能力。
技术关键词
决策
初始聚类中心
聚类算法
可读存储介质
多机器人系统
网络优化
动态
策略
机制
处理器
计算机设备
障碍物
模块
运动
数据