摘要
本发明公开一种异构网络中基于深度强化学习的自适应多路径调度方法,包括在链路管理模块中,引入多路径传输增益模型,用于量化多条链路在聚合带宽提升与端到端时延增加之间的权衡关系,通过筛选性能较好且差异较小的链路集合,有效降低了低性能链路对系统传输性能的负面影响;在深度强化学习模块中,通过结合优先经验回放和异步学习机制,提升模型对不稳定环境的适应性、学习效率和决策准确性,通过动态调整数据包分配策略和传输顺序,实现网络吞吐量与重排序时延之间的优化平衡。本发明采用异步优先重放双深度Q学习算法,能够在动态网络环境中实现链路状态的实时感知以及数据包的决策调度,显著提升网络的聚合吞吐量,并且有效降低传输时延。
技术关键词
深度强化学习
多路径
时延
网络吞吐量
链路状态信息
多路传输
模块
决策
定义
样本
拥塞窗口
全局优化控制
异构网络场景
动态网络环境
异构网络环境
网络传输系统
优化神经网络
系统为您推荐了相关专利信息
节点
时延
时间敏感网络
构建状态转移模型
协方差矩阵
大气环境监测
预警方法
物联网传感器网络
卫星遥感数据
深度强化学习模型
监测计算方法
雷达
相位观测值
监测站
状态空间模型