摘要
本发明提供一种基于可解释性技术的对抗性恶意软件生成方法及系统,该方法使用UCB算法选择最高置信度修改内容解决了强化学习修改动作操作内容选取随机化的问题,通过引入ICM模块鼓励强化学习修改代理去探索那些尚未被充分探索的状态,提高强化学习修改代理探索速率,加速学习过程。为此,本发明主要分为强化学习动作修改器的SHAP优先级计算、基于UCB算法的强化学习动作修改器进行对抗性恶意软件生成、奖励函数设计、基于优先经验重放的强化学习代理学习和对抗性恶意软件功能完整性测试。本发明提高对抗性恶意软件的生成能力和迁移性。
技术关键词
强化学习代理
对抗性
生成方法
修改器
强化学习环境
检测器
矩阵
模块
完整性测试
算法
误差
生成系统
数据
处理器
存储器
沙箱
电子设备
加密
速率
程序
系统为您推荐了相关专利信息
智能报表生成方法
SQL模板
场景
识别查询意图
业务系统数据
深度传感器
地图生成方法
点云信息
视野
激光雷达点云
三维表面特征
图像生成模型
三维表面信息
生成三维模型
对象