摘要
本发明涉及基于LSTM和PPO的飞机导弹规避决策方法,所述方法包括以下步骤:步骤1:采集数据,步骤2:根据仿真中采集的数据,通过长短期记忆网络对飞机和导弹的观测信息进行归一化处理及特征融合,建立飞机和导弹的时序特征。步骤3:基于深度强化学习中的深度确定性策略算法建立分层模型,控制杆量实现具体的飞行控制。步骤4:根据上述定义的模型,分别建立客户端和服务端通信,步骤5:重复上述步骤1‑4,直到达到PPO算法训练结束的条件,终止训练。该方案不仅提高了决策的灵活性和实时性,减少了对传统建模和专家知识的依赖,为现代空战提供了更加智能化的解决方案。
技术关键词
导弹
决策方法
深度强化学习算法
客户端
服务端
方位角
长短期记忆网络
仿真环境
策略
特征提取模块
三维数据结构
飞机油门杆
时序特征
速度
方向舵
系统为您推荐了相关专利信息
自动校准方法
水文模型参数优化
存储计算机程序
自动校准技术
支持用户自定义
模型更新
联邦学习方法
客户端
服务器
联邦学习系统
贝叶斯模型
数据处理模块
事件通知
客户端
后验概率