摘要
本发明涉及一种联邦学习中基于满意度的模型训练激励方法,在基于联邦学习的元计算框架中,计算信息年龄和服务延迟,利用调整质量参数调整数据大小,并结合信息年龄,得到模型质量,利用转换参数调整模型质量和服务延迟,得到满意度,根据满意度和服务器奖励得到服务器效用,根据节点效用和服务器效用构建斯坦伯格博弈模型,其中,服务器作为领导者确定奖励策略,节点作为追随者根据服务器的奖励策略选择节点更新周期,使用深度强化学习算法求解斯坦伯格博弈模型,得到激励方案。利用转换参数调整模型质量和服务延迟,以平衡模型质量和服务延迟,并将用于平衡模型质量和服务延迟的满意度融入服务器效用,从而能够有效激励节点参与联邦学习。
技术关键词
激励方法
节点更新
服务器
深度强化学习算法
年龄
参数
周期
数据
策略
电子设备
时间段
利润
处理器
存储器
框架
系统为您推荐了相关专利信息
爆破振动监测
震动监测方法
振动传感器
视觉监控装置
智能传感器
循环水养殖装置
水产品循环水养殖系统
控制服务器
AI摄像头
自动排污装置