摘要
本发明公开了一种基于元联邦强化学习的通信资源分配方法和系统,所述方法包括:通信调度设备将采集的当前业务的数据提取传输状态特征输入到预先训练得到的元联邦近端策略优化模型;并根据元联邦近端策略优化模型输出的资源分配策略,为业务分配带宽资源;其中,元联邦近端策略优化模型是由边缘服务器利用本地的历史业务数据以及资源分配策略进行元训练,继而通过多个通信调度设备利用本地的历史业务数据以及资源分配策略进行元适应,以及进行在线训练后,将多个在线训练后的元联邦近端策略优化模型的模型参数进行联邦聚合后得到的。应用本发明可以自动调整通信资源的分配,以适应网络环境的动态变化,提高通信效率和网络稳定性。
技术关键词
策略优化模型
通信调度设备
资源分配策略
通信资源分配方法
业务分配
数据
服务器
通信资源分配系统
在线
参数
文本
计算机设备
处理器
可读存储介质
网络
通信效率
图像
存储器
系统为您推荐了相关专利信息
调度管理方法
长短期记忆网络
数据
优先级调度算法
支持向量机算法
数据安全存储方法
监控设备
区块链技术
植物电信号
节点
博弈论模型
资源分配策略
智能调度算法
网络资源分配方法
网络资源分配装置
宽窄带融合
比例公平算法
通信方法
时间序列预测模型
信道状态信息