摘要
本发明属于网络运营服务技术领域,尤其涉及一种基于多智能体强化学习的WiFi多链路接入方法、系统,该方法包括:将WiFi多链路接入问题建模为一个统一的马尔可夫决策过程模型,定义其中的动作、状态以及奖励函数;A P侧获取每个多链路设备对单条链路的局部观测进行集中训练,利用MADDPG多智能体强化学习算法求解获得最优接入策略;AP将训练好的多智能体分发给对应的多链路设备;多链路设备在训练好的智能体指导下进行分布式多链路接入。本发明可以满足未来新兴应用的高吞吐需求,在各链路上本发明均可以实现比传统的基于DCF的接入的性能限更高的网络吞吐量,优化范围从11.2%到23.9%。
技术关键词
多智能体强化学习
链路接入方法
强化学习算法
信息数据处理终端
策略
运营服务技术
参数
决策
网络吞吐量
定义
可读存储介质
模块
处理器
阶段
计算机
样本
框架
系统为您推荐了相关专利信息
自动扩容方法
分布式存储系统
数据迁移
机器学习算法模型
收集系统
节点
路径规划算法
动态路径规划
路径规划方法
模块
车辆轨迹跟踪
轨迹跟踪控制器
连续时间系统
深度确定性策略梯度
后轴
动态调控系统
气象
数据分析模块
智能节水阀门
设备控制指令