摘要
本发明公开了一种基于连续时间近端策略优化强化学习算法的卫星轨道控制方法,包括以下步骤:步骤1、基于连续时间近端策略优化强化学习算法,确定卫星采取的动作即加速度,以及动作的执行时间;步骤2、基于步骤1得到的卫星采取的动作以及执行的时间,实现对卫星轨道控制。本发明通过结合先进的近端策略优化强化学习算法(PPO)与连续时间控制框架,提供了一种高精度、稳定且能效优化的卫星轨道控制解决方案,具有显著的技术先进性和广泛的应用前景,为未来的空间探索和卫星运营提供了强有力的技术支持。
技术关键词
卫星轨道控制方法
强化学习算法
加速度
状态更新
估计方法
深度神经网络训练
ReLU函数
方程
参数
广义
策略更新
偏差
框架
比率
轨迹
因子
数据
系统为您推荐了相关专利信息
温室大棚
对象
深度强化学习算法
时间段
管理方法
克罗恩病预测方法
克罗恩病患者
空间分布特征
健康对照组
年龄
艏向控制方法
三维六自由度
滑模控制器
误差
强化学习网络
海底隧道
智能评价方法
加速度
地震
机器学习模型
配电网光储
电压调节方法
储能设备
光伏发电机
有功功率