摘要
本发明公开了一种基于深度强化学习成像卫星多圈次任务规划方法,分析了多圈次任务规划问题,然后设计了两种不同求解流程的多圈次任务规划方法:基于马尔可夫决策过程的多圈次任务规划方法和基于圈次拆分的多圈次任务规划方法。针对基于马尔可夫决策过程的方法,进行了问题的马尔可夫决策过程建模及特征工程;在设计基于圈次拆分的多圈次任务规划方法时,提出了一种基于迁移学习的多圈次策略模型训练方法。
技术关键词
规划
决策
策略
深度强化学习
训练场景
静态特征
网络
特征工程
滚动基线
模型训练方法
成像窗口
唯一性
观测场景
场景特征
多轨道
标识
参数
周期
系统为您推荐了相关专利信息
数据整合方法
图像配准模型
数据整合装置
搜索模块
测序芯片
欠驱动无人船
扩张状态观测器
动态控制器
二次规划模型
动静态
模态医学影像
融合系统
深度学习融合
影像采集模块
医学影像数据