摘要
面向TCP协议的基于Q‑learning的卫星网络拥塞控制方法及控制系统,涉及网络传输拥塞控制领域,解决目前已有强化学习的拥塞控制方法不适用于卫星网络场景应用的问题,本发明方法通过控制系统实现,所述控制系统包括执行器、转发器和功能模块;该方法实现了适用于强化学习算法的用户态接口与对应的openAI Gym的标准强化学习环境,并提供卫星网络仿真训练环境和基于动态可视化组件。同时考虑到卫星端上算力有限,卫星网络高延迟的特点,进一步设计并实现了基于Q‑learning与瓦片编码的轻量化数据驱动TCP拥塞控制方法。该方法设计了全新的离散动作空间,在保障算法收敛性的同时实现了模型轻量化。
技术关键词
拥塞窗口
转发器
执行器
功能模块
卫星网络环境
拥塞控制系统
拥塞控制方法
协议
网络传输拥塞
拥塞控制算法
强化学习环境
标识符
动态可视化
强化学习算法
时延
消息
因子
可视化模块
系统为您推荐了相关专利信息
空间并联机构
不确定性分析方法
模糊参数
球面
接触点
复合制动系统
智能电液
工况特征
电液复合制动
电液执行器
布图规划
芯片设计方法
功能模块
复用电路
缓冲器优化
多智能体深度强化学习
卫星网络环境
强化学习算法
多智能体强化学习
决策
信息物理系统
子系统
智能产线
功能模块
遥控设备