摘要
本公开的实施例提供基于强化学习的卫星波束调度方法、装置、设备和存储介质。该方法包括:构建包括导航卫星星座中多个卫星各自的卫星标识、各卫星相对于目标区域的俯仰角、各卫星相对于目标区域的方向角和各卫星与目标区域的相对距离的状态空间,构建包括待调度卫星的卫星标识序列的动作空间,基于包括覆盖重数奖励和PDOP奖励的奖励指标设计奖励函数,基于TD3算法,根据状态空间、动作空间和奖励函数训练卫星波束调度的神经网络,得到训练好的策略网络,将目标区域的实时状态向量输入至训练好的策略网络,得到实时动作,以控制实时动作对应的所有卫星波束指向目标区域。该方法能够提高卫星的服务质量。
技术关键词
导航卫星星座
波束调度方法
网络
策略
卫星调度方法
指标
标识
算法
处理器
调度装置
数值
序列
参数
可读存储介质
模块
因子
电子设备
精度
存储器
系统为您推荐了相关专利信息
储氢容器
寿命评估方法
波动特征
多模态
热交换介质
风险评估算法
智能数据库
模糊隶属度函数
模糊集合
巡检方法
场景理解方法
微重力
激光距离传感器
双目相机
智能飞行机器人
多模态传感器
智能控制系统
学习控制模型
中控模块
电热水器
语义知识图谱
动态优化方法
生成访问控制策略
大语言模型
访问控制列表