摘要
本发明公开了一种基于深度强化学习的空天地网络拥塞控制方法,通过分布式节点协作与动态服务速率调整,实现快速动态响应与全局资源优化。该方法基于多节点智能体马尔可夫决策过程建模,设计复合奖励函数,并以此驱动策略优化算法训练;框架上采用“集中训练‑分布式执行”框架,在集中训练阶段优化策略网络参数,在分布式执行阶段各节点基于本地观测独立调整各节点服务速率,无需全局通信。针对卫星网络高动态拓扑及资源受限特性,使用MPLS流量工程协议构建标签交换路径,能够动态适配链路容量波动与卫星轨道移动。本发明实现了空天地节点拥塞控制的精准队列控制并显著提升网络的吞吐量,为空天地网络的高效拥塞控制提供了可靠的解决方案。
技术关键词
网络拥塞控制方法
节点
速率
策略更新
全局通信
动态
独立智能
队列模型
链路
深度强化学习算法
标签交换路径
路由器
资源分配
决策
阶段
端口
系统为您推荐了相关专利信息
动态优先级队列
异构传感器
智能节点
修复机器人
大坝结构
仿真模型
通信设备
电力通信网
设备监测数据
通信网络
群组控制方法
群组控制系统
节点设备
移动终端
云端服务器
量化评估方法
综合评价模型
指标
组合赋权法
退化模型
特高压换流变
时序预测模型
预警方法
主节点
机制