摘要
本申请提供一种基于深度强化学习的跳波束资源分配方法和装置。本申请提供的方法,包括:基于星载设备配备的数据包缓存区,获取每个数据包缓存区下所有到达的数据包的状态信息;基于所述状态信息将所述数据包进行状态重构,得到每个数据包缓存区对应的时延矩阵;将所述时延矩阵输入到训练好的资源分配模型中,预测得到不同的动作向量以及对应的预期回报值;基于更新后的资源分配模型预测预期回报值,将所述预测回报值降序排列,基于排在最前面的预设数量个预期回报值对应的动作向量确定对应的波束,点亮所述波束。本申请提供的基于深度强化学习的跳波束资源分配方法和装置,用以提高对低轨卫星动态环境的适应能力,实现高效的跳波束调度。
技术关键词
波束资源分配方法
深度强化学习
星载设备
时延
周期
矩阵
深度神经网络
重构模块
对象
资源分配装置
计算方法
传播算法
动态
参数
关系
速率