摘要
本发明公开了一种考虑观测不连续条件的航天器智能拦截策略获取方法,包括以下步骤:建立地基测控站的数学模型,利用地基测控站的数学模型传输拦截航天器、逃跑航天器的拦截和逃逸控制策略;结合拦截航天器、逃跑航天器的状态与复杂耦合约束建立观测不连续条件的航天器智能拦截任务问题模型;构建逃跑航天器的随机机动逃逸策略;基于深度确定性策略梯度算法建立拦截航天器的训练奖励框架;基于拦截航天器的训练奖励框架进行智能拦截策略网络训练得到拦截航天器的最优追击策略网络;利用逃跑航天器的随机机动逃逸策略与拦截航天器的最优追击策略网络对逃跑目标进行拦截完成观测不连续条件下的航天器智能拦截控制。
技术关键词
策略获取方法
深度确定性策略梯度
脉冲
轨道
网络
数学模型
坐标系
地球自转角速度
航天器系统
地面测控站
决策
控制策略
追逃博弈
强化学习算法
框架
方程
系统为您推荐了相关专利信息
神经网络模型
车辆部件
图片
信息追溯系统
无线射频识别
深度学习模型
解码器单元
度量
卷积编码器
编码器单元