摘要
本发明公开了一种基于深度强化学习的自动化提取告警数据攻击行为特征方法及装置,方法包括:离线阶段和在线阶段;离线阶段包括:将各类威胁数据进行归类并归一化;筛选数据包的特征并标记;设置奖励,使用标记外的数据进行训练,并存储训练结果放入经验池;再使用一组其他数据,进行偏好设置,增大奖励,整合训练结果,增加为发现的特征;迭代训练,直到设定阈值终止;在线阶段包括:在线更新数据包。本发明能够解决网络威胁情报收集和管理面临来源不同的问题,提高了威胁情报内容和格式的适应性。
技术关键词
深度强化学习
特征方法
标记
语义
计算机程序指令
奖惩机制
模型训练模块
数据分析模块
网络威胁情报
数据处理模块
阶段
数据更新
策略
实体
离线
在线
电子设备
处理器通信