摘要
本发明公开了一种用于半异步联邦学习的客户端激励优化方法及系统,包括:根据客户端的多维私有信息对其进行分类并确定合同形式;确定客户端与服务器的效用函数;对激励优化问题进行数学建模,包含激励相容和个体理性约束;利用一种包含线性组件和非线性偏置组件的不连续网络架构学习方法,优化合同结构以确定最优合同,有效处理服务器效用函数在可行域边界可能出现的不连续性;服务器下发合同,客户端选择并执行;服务器根据客户端执行情况发放奖励并聚合模型,其中聚合权重考虑模型陈旧度和数据质量。本发明通过创新的学习型合同设计,有效激励客户端真实参与,提升系统训练效率和稳定性,并克服了多维信息和效用函数不连续性带来的挑战。
技术关键词
客户端
服务器
网络架构
数学模型
模块
数据
线性单元
参数
学习方法
代表
提升系统
精度
能耗
非线性
模式
关系
时延
系统为您推荐了相关专利信息
前馈神经网络
强化学习网络
多任务
SAC算法
策略
语音特征
个性化语音
卷积神经网络提取
克隆方法
特征提取模块
多源异构数据融合
虚拟驾驶方法
三维场景模型
车辆交通流量
游戏方向盘