摘要
本发明涉及一种用于异步联邦学习的动态超参数调整方法、设备及介质,该方法在更新客户端的本地模型时,基于强化学习的奖励函数进行超参数调整,该奖励函数分为两个部分,其中,第一个部分量化全局模型在客户端数据集上相对损失的减少,第二个部分量化全局模型和本地模型的表征不一致性。与现有技术相比,本发明引入强化学习算法来动态优化超参数,并通过设计特殊的奖励函数,增强了模型的泛化能力,从而提升全局模型的准确性和训练效率。
技术关键词
超参数
客户端
动态
强化学习算法
样本
服务器
处理器
计算方法
可读存储介质
存储器
电子设备
程序
符号
计算机
数据
标签
系统为您推荐了相关专利信息
维修服务系统
仿真模型
动态状态估计
系统实时状态
采集获取系统
鲁棒控制方法
鲁棒控制器
二阶滑模控制器
终端滑模控制器
拉格朗日方程
无人机多光谱图像
反射率数据
发射率
可见光图像
故障诊断方法