摘要
本发明公开了一种基于主动学习的被动操作系统识别方法,包括以下步骤:使用Wireshark提取网络流量的指纹得到指纹数据集;对所述指纹数据集进行预处理,包括分离操作系统类型、IP以及TCP签名,并使用过采样算法BorderLineSMOTE和欠采样算法TomeLink组合采样平衡指纹数据集;将预处理后的指纹数据集输入预先训练得到的指纹识别模型,得到所述指纹识别模型输出的识别结果,所述指纹识别模型是通过主动学习训练得到的;本发明提供的一种基于主动学习的被动操作系统识别方法降低了对数据集数量的需求,解决了机器学习的分类结果偏向于占比较大的操作系统类别的问题,进而提高了识别的准确率。
技术关键词
指纹
操作系统
样本
分类器
数据
标记
算法
查询策略
标签
特征数
报文
标志
列表
编码
数值
代表
过滤器