摘要
本发明公开了一种基于强化学习动态调节拥塞控制算法的方法及系统,该方法包括:在网络状态改变时获取网络传输的往返时间,并将该往返时间映射为网络的当前环境状态,将网络的当前环境状态作为强化学习算法的状态、将在预设的拥塞控制算法列表中选择某一拥塞控制算法作为强化学习算法的动作,利用强化学习算法更新拥塞控制算法列表中各个拥塞控制算法在当前环境状态下的Q值;在网络的连接建立时,根据拥塞控制算法列表中各个拥塞控制算法在当前环境状态下的Q值进行排序,以预设的概率选择当前环境状态下的Q值最小的拥塞控制算法来进行拥塞控制。本发明旨在针对网络传输过程中的网络拥塞问题自动选择合适此网络状况的网络拥塞控制算法。
技术关键词
拥塞控制算法
强化学习算法
网络
动态
列表
微处理器
可读存储介质
计算机程序产品
编程
节点
指令
端口
表达式
钩子
内核
存储器
关系
参数
系统为您推荐了相关专利信息
分拣包装系统
并联机器
智能包装
深度神经网络
视觉
语义特征
游戏数据处理方法
融合特征
指令
图像特征提取
综合评估系统
台账数据
综合评估方法
图像采集模块
风险识别模型