摘要
本发明公开了一种基于深度强化学习的空天地网络拥塞控制方法,包括获取目标空天地网络的数据信息;设定优化目标并进行建模;对决策过程的状态空间、动作空间和奖励函数进行设置;构建决策过程的状态预测模块、奖励再分配模块和优化策略模块;根据构建的模块进行基于深度强化学习的空天地网络的拥塞控制。本发明通过获取多个目标空天地网络的数据信息的数据信息,并基于状态空间、动作空间和奖励函数的设置,以及状态预测、奖励再分配和优化策略的实现,不仅实现了基于深度强化学习的空天地网络的拥塞控制,而且可靠性更高,精确性更好,效果也更好。
技术关键词
网络拥塞控制方法
深度强化学习
信道资源利用率
序列
拥塞窗口
决策
链路
指标
策略
参数
模块
表达式
生成动作
GRU神经网络
功率
速率控制
卫星地球站
周期
系统为您推荐了相关专利信息
救援无人机
生成配送路径
中央调度系统
路径规划技术
分布式共识
重构
轴承故障特征频率
最佳参数组合
包络
滚动轴承振动信号