摘要
本发明公开了一种基于信誉机制和Stackelberg博弈的联邦学习激励机制方法,包括:分析了联邦学习训练过程中任务发布者和执行节点的成本与效用,并将二者的效用函数建模为二阶段Stackelberg博弈模型。其中,任务发布者作为领导者首先制定奖励策略,执行节点作为跟随者基于所述奖励策略动态调整资源分配决策;引入Shapley值为各节点设置公平的奖励预算上限,并采用Karush‑Kuhn‑Tucker(KKT)条件求解每轮模型更新中任务发布者的最优定价策略和执行节点的最优资源分配策略,以最大化各方收益。本发明能够有效激励执行节点提供更多资源参与协作,显著提高了资源利用率,并增强了系统的可持续性。
技术关键词
激励机制方法
发布者
Stackelberg博弈模型
信誉机制
节点
资源分配策略
定价策略
模型更新
KKT条件
拉格朗日
联邦学习系统
信誉值
云服务器
区块链共识
能量消耗
频率
周期
无线基站