摘要
本发明公开了一种基于深度强化学习的多星任务分配策略自适应选择方法,针对卫星姿态机动能力提升、任务数量和卫星规模爆炸增长所带来卫星任务调度问题求解难度的增加以及传统方法求解的局限性,本发明将问题划分为上层多星任务分配和下层单星调度两个部分,通过两个部分的多次交互实现方案的迭代寻优,针对上层任务分配问题,提出了基于强化学习的自适应搜索方法,实现了基于深度强化学习的任务分配策略自适应选择。
技术关键词
任务分配策略
深度强化学习
任务调度模型
阶段
局部搜索方法
三元组
深度Q网络
成像
贪婪策略
变量
参数
唯一性
决策
规模
有效性
模式
邻域
系统为您推荐了相关专利信息
组网雷达
资源调度模型
资源调度方法
散射点
重构条件
图像分类方法
交叉注意力机制
多头注意力机制
生成特征向量
幅值
电池荷电状态
再生制动控制方法
隶属度函数
模糊控制器
模糊控制模块
鲸鱼优化算法
煤气
BiLSTM模型
最佳参数组合
数据