摘要
本申请涉及一种基于博弈对抗自学习的无人蜂群智能任务调度方法,设置了适应性更高的状态空间、动作空间、状态转移规则和奖励函数,可以更好地用于博弈对抗自学习;对于禁止动作没有采用终止执行的策略,而是对其进行扰动,将其转化为可执行动作,使得算法的有效样本更多,提高了算法运行效率;将强化学习中的演员‑评论家算法改进用于无人蜂群任务调度,生成博弈对抗自学习无人蜂群任务调度策略,该方法不同于监督学习,不需要大量的数据样本。
技术关键词
任务调度模型
任务调度策略
智能任务调度方法
载荷
网络
任务调度装置
样本
模型训练模块
可读存储介质
数据
算法
参数
计算机
因子
处理器