摘要
本发明公开了一种基于自适应MADDPG的星群规避自主决策方法,属于航天器任务规划技术领域,包括以下步骤:建立脉冲式星群对空间非合作目标规避任务模型;设计星群威胁规避自主决策的奖励函数;构建威胁场景预测神经网络,并进行训练;基于奖励函数,构建星群威胁规避自主决策网络;基于MADDPG算法,训练不同威胁场景下的星群威胁规避自主决策网络;将非合作目标与星群信息输入至训练后的威胁场景预测神经网络中,得到当前威胁场景,并选择对应威胁场景下训练的星群威胁规避自主决策网络,进行星群规避的自主决策。本发明解决了现有算法难以处理的由大量卫星组成的星群对非合作目标抵近威胁进行规避时产生的高复杂度的决策问题。
技术关键词
全局状态信息
自主决策方法
网络
场景
脉冲
表达式
坐标系
运动
矩阵
因子
方程
加速度
参数
数据更新
策略
线性
算法
航天器