一种基于分层参数化强化学习的轨道行为智能决策方法与系统

正文

推荐专利

申请号：CN202510109767

申请日期：2025-01-23

公开号：CN120012587A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于分层参数化强化学习的轨道行为智能决策方法与系统，属于航天科学领域技术领域。该方法将卫星视为了逃逸航天器，首先采取了将逃逸航天器的控制动作空间进行分层参数化的策略。同时，设计了两个层级的Actor，一个是主Actor，另一个是子Actor。主Actor在高层次上负责选择合适的子空间，子Actor从选择的子空间中选择合适的动作。通过两个层级Actor的选择，能够实现对复杂任务环境的高效管理，提高控制系统的决策质量和灵活性。执行方法过程中，采用基于智能算法的自适应控制技术，可以根据航天器实际运行状态和环境条件的变化，动态调整控制策略，提高对航天器轨道控制的精度和效率。

技术关键词

智能决策方法网络加速度分层强化学习追踪航天器推力方程航天器轨道控制参数智能决策系统线性空间模块智能算法控制策略高层次层级

系统为您推荐了相关专利信息

一种极低温条件下充电及供电一体控制系统及方法

一体控制系统保温系统太阳能发电模块保温模块风力发电模块

一种基于扩散模型保持局部细节的虚拟试衣系统及方法

虚拟试衣系统虚拟试衣方法服装模特噪声图像

接入网的组网方法、传输方法、装置、系统、设备及介质

虚拟MAC地址接入节点数据传输装置数据传输方法链路

一种面向动态障碍物的强化学习无人叉车避障调度方法及系统

动态障碍物无人叉车栅格地图全局路径规划激光雷达点云数据

一种控制激光辐射发散的方法

介质时序多模态激光器动态

一种基于分层参数化强化学习的轨道行为智能决策方法与系统

站点导航

APP 下载