摘要
本申请提出一种结合强化学习与最优控制的轨道博弈系统及方法,其中,系统包括:初始化问题设置模块、优化求解模块、强化学习模块、虚拟环境模块与循环执行模块,该系统通过初始化虚拟环境与约束条件,利用优化求解模块基于CW方程求解航天器轨道控制量,结合强化学习模块中的TD3算法生成最终控制策略。本申请提出的系统在虚拟环境中考虑J2摄动影响,持续迭代并优化控制策略,在不完全信息和非线性扰动下实现高效可靠的轨道追逃博弈,适用于复杂空间环境下的多航天器自主决策任务。
技术关键词
坐标系
计算机执行指令
更新网络参数
模块
强化学习网络
决策
航天器轨道控制
方程
虚拟环境交互
加速度
优化控制策略
追逃博弈
博弈方法
可读存储介质
计算机程序产品
处理器
算法
系统为您推荐了相关专利信息
特征提取方法
负荷
数字滤波技术
评分方法
机器学习方法
水产养殖智能
水下机器人
防治系统
饲料投放装置
分析模块
自动化巡检系统
传感器阵列
图像采集单元
模块
规划
评估算法
评分算法
有效性
计算机设备
软件开发技术