摘要
本发明公开了一种基于深度强化学习的联邦模型中毒攻击防御方法,属于信息安全研究领域。本发明在联邦学习框架的基础上引入了深度强化学习,利用DQN算法根据客户端中用户的局部模型权重及其恶意度筛选出参与全局模型聚合的用户,确保所选用户无恶意并且有利于全局模型性能的优化。此外,在深度强化学习中,本发明设计了一系列具有影响力的状态参数,其中引入马氏距离衡量用户的恶意程度,即该用户是恶意攻击者的概率,并精心构建了一个奖励函数,以提高深度强化学习决策的科学性。本发明能够有效防御恶意用户向数据或模型投毒所导致的模型中毒攻击,在客户端不可信的环境下仍然能够保证最终全局模型的准确性,并优化模型性能。
技术关键词
深度强化学习
攻击防御方法
联邦模型
客户端
服务器
DQN算法
列表
神经网络参数
信息安全研究
神经网络训练
贪婪策略
网络同步
协方差矩阵
因子
样本
计算方法
数据
系统为您推荐了相关专利信息
数据实时监测方法
网络照明
综合照明
照明网络
多源异构数据
干燥塔
电流电压传感器
信息论方法
长短期记忆网络
强化学习算法