摘要
本发明公开了一种基于双层强化学习的星间链路卫星测控调度方法及系统,包括:建立星间链路卫星测控调度模型,星间链路卫星测控调度模型的优化目标是最大化任务的总收益;通过上层优化模型根据请求的任务与地面站天线的支撑关系,将所有任务分配到地面站天线上;下层优化模型通过上层优化模型提供的任务分配方案,计算该动作下的任务收益回报和下一步的状态,实现上层优化模型和下层优化模型的信息反馈交互,双层优化过程循环多次,下层单天线调度结果反馈到上层指导下一次的卫星测控任务分配,确定每个任务执行的时间窗口。该方法基于双层的深度强化学习算法,上层优化卫星测控任务分配问题,下层优化单天线任务调度问题,提升求解的质量和速度。
技术关键词
地面站天线
链路
启发式算法
调度系统
深度强化学习算法
采取行动
决策
计算机存储介质
任务调度
关系
规划
模块
变量
策略
速度
系统为您推荐了相关专利信息
电商购物平台
出行计划
生成兴趣标签
生成推荐信息
对象
评估系统
电力负荷预测模型
遗传优化算法
智能充电管理系统
长短期记忆网络
仓储智能
移动终端
仓储信息管理
集成系统
集成方法
主控装置
监测系统
铅酸电池组
告警模块
算法模块