摘要
本发明提出一种基于强化学习的子母飞行器抛撒时机在线解算方法,首先基于解析解/准解析解预测母飞行器自身轨迹,基于优化方法评估子飞行器在不同初始状态下的飞行能力,建立子飞行器在不同初始状态下的飞行能力数据集,然后建立子母飞行器的马尔可夫决策过程模型,最后基于融合神经网络寻优的强化学习算法实现抛撒时机在线快速解算。本发明解决母飞行器在飞行过程中受制导精度、控制精度、外界干扰等影响,实际轨迹偏离期望轨迹,导致子飞行器集群实际抛撒位置偏离期望抛撒位置,从而严重影响子飞行器抵达目标效果的问题,以及解决为在各种飞行环境下均能够完成预期飞行任务,需要抛撒时机能够在线快速解算的问题。
技术关键词
在线解算方法
子母飞行器
强化学习算法
融合神经网络
集群
决策
轨迹参数
计算机程序产品
动作策略
因子
时间段
数据
速度
终端
元素
定义