摘要
本发明属于无线漫游领域,公开了一种智能漫游决策系统、方法及智慧屏,包括多个终端设备层、边缘计算层和云端服务层;多个终端设备层收集多维网络环境参数,并进行本地模型训练;边缘计算层通过拜占庭鲁棒性聚合算法对多个终端设备层的模型参数进行聚合;云端服务层对聚合后的模型参数进行知识蒸馏,得到全局知识,并向每个终端设备层全局知识;终端设备层实时采集当前网络环境的目标多维网络环境参数,提取目标多维网络环境参数的时序特征和空间特征,并得到多维网络环境状态向量,基于多维网络环境状态向量进行粗选和精调两阶段决策,得到目标接入点。本发明将强化学习决策问题分解为粗选和精调,提高决策效率和准确性。
技术关键词
终端设备
接入点
网络结构
时序特征
深度强化学习
神经网络处理单元
决策系统
随机梯度下降
时序依赖关系
多头注意力机制
差分隐私
云端
双向长短期记忆网络
鲁棒性
参数
算法
蒸馏