摘要
本发明公开一种面向集群的多智能体协作任务规划方法,包括:构建巡航仿真交互场景,确定输入至强化学习网络模型的数据,强化学习网络模型用于输出多个子任务的时序、每个子任务对应的智能体类型和智能体数量;将强化学习网络模型的输出数据转换为巡航约束条件;根据巡航约束条件进行分支定界搜索最优组合方案,规划各智能体动作开始时间和结束时间,完成智能体子任务规划。本发明将任务分配组合问题与任务执行优化问题进行解耦,实现快速的多智能体任务规划。在训练阶段生成任务编队,构建任务分配决策智能体,通过强化学习算法生成包含各子任务所需的智能体类型和数量的预案;在任务生成包含智能体任务分配和执行时间的智能体任务执行方案。
技术关键词
强化学习网络
节点
规划
分支定界方法
深度强化学习算法
决策
样本
时序
门控循环单元
可用智能
代表
集群
策略
仿真环境
算法模型
关系
系统为您推荐了相关专利信息
告警数据处理方法
异构
预训练模型
元素
编码向量
网络靶场
模型构建方法
主节点
指令
模型构建装置
柔顺控制方法
双臂机器人系统
末端路径规划算法
控制策略
阻尼
分类模型训练方法
嵌入特征
列表
关键词
有向无环图