摘要
本发明属于飞机智能体航迹规划技术领域,具体地涉及一种基于集中式改进PPO算法的协同航迹规划方法。包括:步骤1:针对协同打击任务,将攻击机和干扰机/诱饵机组成局部编队,建立基于局部编队的协同航迹规划模型;步骤2:引入策略训练技巧,建立基于集中式BRPPO贝塔循环近端策略优化算法的下层协同航迹规划模型,飞机智能体在航迹规划环境中迭代循环,求解最优策略,该最优策略即协同航迹规划。本发明提出了离线训练、在线规划的协同航迹规划方法,省去了在线优化的时间,提高了航迹规划的求解速度和实时性;本发明采用基于学习的神经网络求解端到端非线性近似最优航迹,提高了航迹规划的精度和最优性,有利于实施多机精细航迹和战术配合。
技术关键词
协同航迹规划方法
策略网络模型
诱饵
算法
航迹规划技术
飞机
加速度
在线
双机
因子
非线性
基础
离线
决策
批量
坐标
系统为您推荐了相关专利信息
精准控制系统
远程控制模块
多元线性回归算法
训练集数据
监测数据采集技术
人工智能技术
跟踪系统
大数据
模拟退火算法
区块链存储技术