摘要
本发明公开了基于网络覆盖动态匹配控制的多智能体任务分配方法,包括如下步骤:多智能体自组织成网络并划为N个子网络,子网络采用领航者和追随者模式,并由领航者执行子网络管理和决策;各子网络获取当前的环境状态,利用分层深度强化学习模型的高层决策,选择探索任务域或寻找其他子网络;利用分层深度强化学习模型的低层决策执行智能体移动,直至找到任务域或其他子网络;通过网络拓扑控制对找到任务域或其他子网络的子网络进行网络分割或融合,形成覆盖子网络或新子网络;覆盖子网络中的智能体利用任务分配优化模型完成任务执行,任务执行完成后转为新子网络。该方法可在网络基础设施缺失且未知任务分布的环境中利用有限规模的多智能体探索任务分布,并完成任务分配,以减少任务响应时间,提高任务完成率。
技术关键词
任务分配方法
深度强化学习模型
网络拓扑控制
决策
动态
网络管理
信息更新
分层
连线
密度
模式
组织
规模
系统为您推荐了相关专利信息
深度强化学习
时间敏感网络
异构设备
异构网络环境
策略
管理策略
管理方法
监控应用程序
云服务器
监控模块
动态切换控制
切换控制策略
车辆模型
分段线性系统
矩阵
虚拟键盘生成方法
加密算法
电子设备
坐标
服务端