摘要
一种基于深度强化学习的非合作航天器主动跟踪方法,本发明涉及非合作航天器主动跟踪方法。本发明属于航天航空领域。本发明的目的是为了解决现有算法无法融合航天器动力学模型以及卫星轨道动力学,无法有效的在保证跟踪精度的基础上提升算法鲁棒性,无法有效的从训练样本中有效提取出关于目标的时序相关信息等缺陷。过程为:1、获得追逐航天器的位置以及速度;2、构建演员网络和评论家网络,以及损失函数;3、构建奖励函数,获得训练好的演员网络、评论家网络;4、获得目标航天器与追逐航天器之间位置与期望位置的差距,以及目标航天器与追逐航天器之间的速度差,输入训练好的演员网络,训练好的演员网络输出当前时间步的动作。
技术关键词
主动跟踪方法
网络
坐标系
深度强化学习
编码
参数
速度
非合作航天器
航天器动力学
连续状态空间
连续动作空间
传播算法
输出特征
算法鲁棒性
定义
轨道
数据
基础
策略
系统为您推荐了相关专利信息
水质传感器
前馈神经网络
控制器
联锁逻辑
污水处理设备
干扰控制方法
频率
卡尔曼滤波
遗传算法
数据获取模块
涡扇发动机
门控循环单元
时序依赖关系
表达式
矩阵
可信交易方法
负荷预测模型
分布式资源
属性基加密
功率