摘要
本发明公开了一种基于图近端优化算法的可变规模卫星群轨道规划方法,实现在节点数量动态变化与通信链路受限条件下的实时、高效控制。首先,将卫星群在时刻上的轨道与通信关系抽象为动态图。随后,构建基于图神经网络与循环神经网络叠加的强化学习结构。策略与价值函数采用强化学习近端策略优化算法在星上异步迭代,所有计算和参数更新均在卫星端完成,无需中央主控卫星。各卫星在完成本地算法更新后,与满足可靠度条件的近邻卫星交换参数差分,并按照卫星链路质量和物理距离混合权重进行加权。该方法可广泛应用于对地成像、全球通信、导航等需要星座级协同的应用场景,为大规模卫星群安全、高效、自主运行提供了完整的技术体系。
技术关键词
轨道规划方法
卫星群
规模
节点
强化学习环境
强化学习框架
通信链路
神经网络参数
库塔算法
全球尺度
策略
积分误差
邻域
非球形
仿真器
推力