摘要
本发明公开了一种基于数据生成的网站指纹识别方法,涉及网络空间安全技术领域,本发明采用监督学习策略,结合深度学习的序列处理模型以及数据生成模型,解决数据增强方法所面临的不可控性、不真实性和难以打标记问题;控制数据生成过程方面,采用双向长短期记忆网络BiLSTM进行特征提取,BiLSTM模型能够充分考虑网络流量数据的上下文信息;同时采用CVAE利用网站流量的条件信息,在生成过程中引入控制变量,通过编码器对潜在特征进行压缩,再由解码器重构,保证生成的数据保留关键的流量特征,数据增强方面,使用带标签的数据集进行特征提取和生成模型的训练,然后向模型输入大量无标签数据,得到大量有标签数据,对原始数据进行数量增强。
技术关键词
网站指纹识别方法
数据生成模型
特征提取模型
BiLSTM模型
双向长短期记忆网络
无标签数据
监督学习策略
支持向量机模型
网络流量数据
带标签
解码器
分类器训练
序列
训练集数据
打标记
编码器
随机噪声
定义
系统为您推荐了相关专利信息
反馈方法
关系抽取模型
级联
双向长短期记忆网络
融合注意力机制
三维图像重建方法
组织切片
原始图像数据
条纹
三维重建图像
特征模板
运动特征
电子设备
数字信号处理芯片
数据处理方法