摘要
本发明公开了一种飞行器实时资源分配方法及系统,涉及飞行器控制技术领域,用于解决飞行器资源分配导致资源限制与需求冲突的技术问题,所述飞行器实时资源分配方法,包括:构建飞行器的任务优先级队列和资源状态矩阵,并定义状态空间;定义动作空间,并根据动态资源分配目标定义奖励函数;搭建飞行器的实时控制软件环境;准备双深度Q网络的训练数据,并构建双深度Q网络结构;构建经验回放缓冲区,进行双深度Q网络训练,并更新主网络的参数;获取飞行器的状态和动作之间的价值函数,通过价值函数使飞行器做出资源分配最优决策;使用动态规划实时细化分配资源,实现满足资源约束条件下的最大化任务收益,完成飞行器实时资源分配。
技术关键词
深度Q网络
资源分配方法
动态规划算法
队列
动态资源分配
决策
参数
资源约束条件
资源分配系统
网络结构
飞行器系统
资源定义
飞行器控制技术