摘要
本发明公开了一种卫星多点目标成像的深度强化学习调度方法和系统,通过对任务目标的全部可见时间窗口进行目标可见窗口的预报,建立四维矩阵进行储存各个卫星各时间窗口到任意其他卫星其他时间窗口的姿态转换时间,将遥感卫星任务执行成像任务的过程建模为智能体马尔科夫决策过程,定义状态空间、动作空间、奖励、状态转移概率和折扣因子,在每一个训练步长中进行约束的表达,建立策略网络和价值网络,执行PPO算法训练模型,收敛得到优化策略,输入测试数据并初始化环境,在每个时间步长读取策略并输入可行的目标的观测开始时间与结束时间,输出任务规划策略。本发明能够有效地适用于遥感卫星多点目标成像任务规划。
技术关键词
深度强化学习
成像
网络
读取策略
矩阵
动作策略
决策
地面
因子
轨道
参数
算法
定义
初始化系统
视场角
裁剪方法
规划
姿态误差
系统为您推荐了相关专利信息
变压器在线监测
数据处理方法
异常事件
电力设备在线监测技术
分发策略
多层次特征提取
图像分类方法
原型
编码器
降维特征
点焊机器人
计算机控制系统
瑕疵
在线监测系统
数据