摘要
本发明属于联邦学习技术领域,尤其涉及一种基于深度强化学习的自适应异步联邦学习方法及系统,方法包括:将可穿戴设备作为联邦学习客户端,客户端与服务端进行通信,在服务端上全局模型更新的过程中,利用深度强化学习自适应地确定每个全局轮中客户端的聚合数量,包括:将第t轮迭代中,客户端参与聚合的数量作为智能体的动作;智能体观测联邦学习环境中的状态并输出动作;智能体输出的动作在联邦学习环境中执行后,环境给出下一个状态和奖励,迭代训练直至最大化累计奖励,得到最终的动作。本发明综合考虑了联邦学习中的数据量不平衡、设备计算能力不同、资源约束等问题,采用深度强化学习进行自适应参数的计算,提升联邦学习系统训练效率。
技术关键词
联邦学习方法
客户端
服务端
模型更新
联邦学习系统
深度强化学习方法
联邦学习技术
网络
采取行动
可穿戴设备
策略
处理器
资源
参数
程序
可读存储介质
存储器
损耗
系统为您推荐了相关专利信息
认证鉴权
互联网服务平台
消息管理
多系统
通信管控系统
流媒体服务器
回放模块
全景视频采集
深度学习方法
分片