摘要
本发明涉及网络安全技术领域,尤其涉及一种基于强化学习的自适应聚合防御复杂投毒攻击方法。本发明提出了一种基于强化学习的自适应聚合方法AdaAggRL,以挫败复杂的投毒攻击,通过比较客户端数据分布的稳定性来确定局部模型的聚合权重。具体地,首先使用分布学习根据上传的模型参数来模拟客户端数据分布;然后,利用最大均值差异计算当前局部模型数据分布、其历史数据分布和全局模型数据分布的两两相似度,以评估客户端数据分布的稳定性;考虑到分布学习的精度可能会影响上述相似度的计算,使用重构相似度作为分布学习质量的评价指标;最后,基于上述三种分布相似度和分布学习的重构相似度,使用策略学习方法TD3自适应确定聚合权重。
技术关键词
数据分布
客户端
策略学习方法
深度强化学习算法
卷积神经网络提取
重构
强化学习环境
网络安全技术
样本
中心服务器
指标
定义
超参数
标识符
度量
系统为您推荐了相关专利信息
通信平台
传输保护方法
管理中心
客户端
SM4算法
四轮独立驱动独立转向
样本
车辆路径跟踪控制
智能协作
深度强化学习算法
保护系统
数据安全
FP‑Growth算法
计算机程序分析技术
度量