摘要
本申请公开了一种基于分层深度强化学习的多机空战协同方法、系统、装置、存储介质、设备和计算机程序产品,包括:获取环境感知信息和发送自外部飞行器的外部动作决策信息;将环境感知信息和外部动作决策信息输入战术决策网络,以获得对本地飞行器的飞行状态期望信息;将状态期望信息和环境感知信息输入控制决策网络以获得对本地飞行器的本地动作决策信息。本申请通过引入外部动作信息增强观测内容、采用分层网络结构提升决策的抽象能力,并通过上下层协同实现策略到执行的闭环控制,使得飞行器间的角色分配更加精准、协作行为更加高效,进而提升了多机协同空战中的任务完成效果,降低了作战失误与资源浪费的风险。
技术关键词
环境感知信息
深度强化学习
飞行器
协同方法
飞行状态数据
作战环境
分层网络结构
控制决策模块
上存储计算机程序
可读存储介质
协同系统
计算机程序产品
处理器
闭环控制
上下层
存储器
系统为您推荐了相关专利信息
知识图谱模型
振动压实成型
效率评估方法
动态上下文
深度强化学习算法
数字孪生模型
星地协同
资源分配
数据资产管理
资源状态信息
自动化设备控制方法
智能控制模型
设备运行效率
设备运行状态
深度Q网络
协调控制系统
智能驱动控制模块
协调控制方法
空气弹簧
电磁主动悬架