摘要
本发明提出一种基于信息熵驱动的源代码对抗攻击与防御方法,属于人工智能和网络安全技术领域,本发明为解决传统代码对抗样本生成方法中样本转换空间庞大且复杂、攻击成功率受限,以及模型调用成本高的问题,包括以下步骤:构建代码数据集,并对代码数据进行预处理;计算预处理后的代码数据集中各类标识符的出现频率,构建标识符语料库;根据输入样本的源标识符,计算对应的频率差熵与复杂度熵,目标替换标识符的结合贪婪算法迭代选择高熵标识符作为扰动因素,对输入样本中的源标识符进行对应替换,生成对抗样本;将对抗样本与初始训练集进行数据融合作为增强训练集,对目标模型进行对抗训练,生成增强鲁棒性和对抗攻击防御能力的目标模型。
技术关键词
标识符
信息熵
贪婪算法
复杂度
频率
数据
训练集
样本生成方法
网络安全技术
字符
深度学习模型
鲁棒性
度量
分布特征
语义
受限
误差
定义
基础