摘要
本发明属于航空航天技术领域,具体公开了一种基于生成对抗逆强化学习的航天器集群博弈方法及系统,所述方法包括:建立追逃双方相对运动动力学模型,进而基于二人零和博弈模型建立追逃双方的博弈关系模型;基于追逃双方的博弈关系模型,利用微分博弈方法求解追逃博弈的纳什均衡解,生成专家数据库;基于专家数据库设计生成对抗逆强化学习算法;利用生成对抗逆强化学习算法对追逃双方的博弈关系进行求解,得到最优博弈策略。本发明将最优控制方法和人工智能方法相结合来求解航天器集群虚拟主星对非合作目标的抵近策略,解决了人工智能方法在解决轨道博弈问题时,难以收敛、奖励设置困难、效果差的问题,最终实现对目标高效、精确的抵近。
技术关键词
航天器集群
博弈方法
专家数据库
强化学习算法
轨迹
笛卡尔坐标系
生成对抗网络
人工智能方法
关系
读取存储介质
航空航天技术
追逃博弈
计算机
方程
策略
拉格朗日
两点
可读存储介质
处理器
系统为您推荐了相关专利信息
演变分析方法
局部放电特征
换流器
时间变化曲线
电信号
防碰撞方法
高精度激光测距
运动轨迹预测
风杯传感器
激光雷达传感器