摘要
本发明公开了一种感知数据异构的联邦学习资源分配方法,该方法首先建立以基站为中心的联邦学习FL的场景模型,根据客户端数据分布情况和参与情况,建立客户端评估模型。其次根据基站与客户端节点之间的关系,建立时间模型和能量模型。然后以FL的客户端评估模型和过程中的能量以及时间开销作为优化目标,构建资源分配的优化问题。最后根据优化问题,构建马尔可夫决策模型,采用双延迟深度确定性策略梯度算法TD3,获得当前最优客户端选择策略以及资源分配方案,并且不断训练更新TD3模型,获得最优客户端选择策略以及资源分配方案。本发明保证了FL的精确度,有效降低了FL客户端所需要的时间以及能量。
技术关键词
学习资源分配方法
客户端
数据分布
异构
深度强化学习模型
基站
模型更新
马尔可夫模型
能量消耗
决策
策略
超参数
噪声功率
场景
样本
算法
信道
系统为您推荐了相关专利信息
多源异构数据
滑动窗口采样
时序
前馈神经网络
文本
故障诊断方法
特征提取器
分类器
原型
初始聚类中心