摘要
本发明提供一种基于强化学习的对抗混淆流量生成方法,包括:将流量行为识别模型作为环境,在环境下采用强化学习模型基于原始流量数据包进行多次对抗学习,得到最终混淆后的流量数据包,每次包括:以本次流量数据包作为当前状态,首次为原始流量数据包,其他次为前一次混淆后的流量数据包;智能体以最大化累计奖励为优化目标,根据当前状态从预设混淆动作空间中选择本次的混淆动作,包括需插入的字节和指定位置;将需插入的字节插入本次流量数据包的指定位置,生成本次混淆后的流量数据包,通过环境得到该混淆后的流量数据包分类结果和与分类结果误差正相关的奖励,若分类结果与类别标签不同,基于本次生成的流量数据包构建最终的流量数据包。
技术关键词
网络节点
流量生成方法
强化学习模型
特征提取模块
网络通信系统
数值
数据
处理器
信息处理
分析模块
可读存储介质
存储器
标签
电子设备
指令
计算机
误差
系统为您推荐了相关专利信息
状态编码器
动作特征
机器人
融合特征
RGB特征
识别跟踪方法
激光测距装置
图像分析模块
数据存储模块
高清摄像头
数据抽样
离群点
异常点
RANSAC算法
神经网络处理器
环境图像数据
闭环检测方法
语义标签
拓扑图
特征提取模型
图像生成模型
样本
图像超分辨率重建
特征提取网络
生成对抗网络