摘要
本申请涉及一种基于演化强化学习的星座设计方法、装置、设备和存储器。所述方法包括:将星座设计任务问题转化为多星对地观测任务规划问题;将多星对地观测任务规划问题建模为多目标组合优化问题;采用基于多目标遗传算法和多智能体深度强化学习算法的双层架构的双层循环模型对多目标组合优化问题进行求解,优化星座部署设计方案;双层循环模型用于通过基于多智能体强化学习的内层循环实现动态目标观测的任务规划,并将行动网络的奖励和损失反馈至外层循环,通过基于多目标遗传算法的外层循环以寻找一组回报最大、损失最小且满足约束条件的卫星星座参数为目标,优化星座部署设计方案。本方法提高了方案设计效率和时间窗口数据的表征能力。
技术关键词
星座设计方法
深度强化学习算法
遗传算法
多智能体强化学习
动作策略
多智能体深度强化学习
规划
网络
计算机可读存储器
表达式
参数
处理器
计算机设备
动态
内存
决策
资源
模块