摘要
本发明涉及一种基于分布式深度Q网络的多智能体算法模型,包括以下步骤:通过全局状态信息库初始化全局状态信息,将战场态势、飞行器状态和目标信息整合成全局状态信息,并将其共享给所有智能体,每个智能体在接收到全局状态信息后生成各自的动作概率分布,决策层接收信息共享层传递的各个智能体的动作概率分布,并进行堆叠形成动作概率分布数组,智能算法根据数组信息进行决策生成多智能体概率分布更新策略,环境中的智能体根据决策层提供的概率分布更新策略来进行动作选择,总之本发明显著提高了空战中各单位的协同作战能力,增强了系统的实时性和环境适应性,即使在部分智能体出现故障或受到干扰的情况下仍能继续运行。
技术关键词
全局状态信息
深度Q网络
算法模型
智能算法
飞行器
策略
决策
模块
系统为您推荐了相关专利信息
鲸鱼优化算法
自动化控制模块
混合装置
高纯度二氧化碳
储存装置
阻抗复合式消声器
建模方法
代表
数据驱动模型
频率
动态优化系统
康复动作
个性化策略
居家
实时数据