摘要
本发明涉及多智能体任务调度领域,提出一种基于优先级的多智能体环境任务调度方法。在多智能体环境的任务调度过程中,利用Nash Q‑learning算法计算各智能体在不同状态下的最优动作策略,通过求解智能体间策略博弈的Nash均衡以优化任务优先级与资源分配;接着实时更新智能体的状态与策略,通过奖励机制不断优化学习策略;在任务执行阶段,根据计算出的智能体动作策略进行任务分配,并动态调整任务队列与执行顺序,保障任务执行效率与资源利用率;最后通过仿真验证与性能分析,评估算法在不同情境下的适应性与优越性。本发明能够有效提升多智能体环境下任务执行效率与资源利用效率,尤其适用于任务优先级动态变化的实时调度场景。
技术关键词
任务调度方法
动作策略
动态更新
状态转移模型
系统资源消耗
变量
队列
生成智能
评估算法
能耗
拉格朗日
模型更新
资源分配
指标
因子