摘要
本发明公开了一种基于深度强化学习的观测星座优化方法,涉及卫星智能技术领域,包括以下步骤:确定待观测星座的星座构型并获取其卫星轨道参数;基于卫星轨道参数,利用强化学习算法构建星座优化策略;建立状态空间模型、动作空间模型并设计奖励函数;基于最优策略函数,利用改进后的TD3算法对状态空间模型、动作空间模型和奖励函数进行处理,得到最终优化策略;通过待观测星座执行最终优化策略,完成对观测星座的优化。本发明改善了传统的TD3的学习训练效率低、优化模型不稳定性的缺点,通过引进优先经验回放和动态策略噪声改善了星座优化设计决策模型的训练效率和稳定性,提高了星座对地观测性能。
技术关键词
观测星座
星座构型
卫星轨道参数
状态空间模型
深度强化学习
策略
网络
智能体模型
强化学习算法
星座优化设计
表达式
噪声
长轴
因子
样本
仿真场景
机制
系统为您推荐了相关专利信息
欺骗攻击检测方法
可靠传感器
信息物理系统
凸优化理论
线性
节点
链路带宽资源
宽度神经网络
物理
生成器网络
重构控制方法
二次设备
动态信誉
深度强化学习模型
指纹
自动化生成方法
规划系统
测试场景
深度强化学习模型
训练深度学习模型