摘要
本发明公开了一种基于分层参数化强化学习的轨道行为智能决策方法与系统,属于航天科学领域技术领域。该方法将卫星视为了逃逸航天器,首先采取了将逃逸航天器的控制动作空间进行分层参数化的策略。同时,设计了两个层级的Actor,一个是主Actor,另一个是子Actor。主Actor在高层次上负责选择合适的子空间,子Actor从选择的子空间中选择合适的动作。通过两个层级Actor的选择,能够实现对复杂任务环境的高效管理,提高控制系统的决策质量和灵活性。执行方法过程中,采用基于智能算法的自适应控制技术,可以根据航天器实际运行状态和环境条件的变化,动态调整控制策略,提高对航天器轨道控制的精度和效率。
技术关键词
智能决策方法
网络
加速度
分层强化学习
追踪航天器
推力
方程
航天器轨道控制
参数
智能决策系统
线性
空间模块
智能算法
控制策略
高层次
层级
系统为您推荐了相关专利信息
一体控制系统
保温系统
太阳能发电模块
保温模块
风力发电模块
虚拟MAC地址
接入节点
数据传输装置
数据传输方法
链路
动态障碍物
无人叉车
栅格地图
全局路径规划
激光雷达点云数据