摘要
本发明公开一种基于深度强化学习的无人机集群任务链调度方法及产品,涉及集群任务链调度领域,方法包括,将联合策略‑价值网络结合到蒙特卡洛搜索树算法中得出训练样本集,利用训练样本集训练联合策略‑价值网络,最终既可以利用训练后的联合策略‑价值网络得出任务链调度的最优解,也可以将训练后的联合策略‑价值网络结合到蒙特卡洛搜索树算法得出任务链调度的最优解。本发明中,利用联合策略‑价值网络和蒙特卡洛搜索树算法相结合的方式确定最优任务链,提高了集群任务执行的效率与可靠性。
技术关键词
节点
优化约束条件
深度强化学习
蒙特卡洛
网络
策略
训练样本集
无人机集群系统
算法
链路
决策
载荷
通讯
指标
关系
计算机程序产品
理论
系统为您推荐了相关专利信息
无人船系统
编队控制方法
无人船设计
动作捕捉装置
无人船编队
共享停车场
车辆信息采集系统
无线通讯组网
公共交通数据采集
车辆信息采集方法
垃圾收集
垃圾中转站
垃圾处理站
任务调度方法
拓扑图