摘要
本发明公开了一种网络入侵检测中数据不平衡处理方法,方法包括:利用随机稀疏投影增强原始特征的训练多样性;然后将特征空间聚类为预定义数量的子空间,并使用信息论和簇大小相结合的基于聚类的无限特征选择算法CInf‑FS评估每个子空间内的特征;在剔除冗余特征后,通过重采样生成候选子集,并迭代计算子集间多样性与子集与特征空间的相似度,从而选择最优子集。本发明利用选择的最优子集构建平衡数据集训练分类器,并在数据集上验证算法性能,通过评估指标进行评估,提供了一种对数据不平衡影响小,性能更佳,鲁棒性更高的解决方案。
技术关键词
网络入侵检测
斯皮尔曼等级相关系数
矩阵
数据
训练分类器
统计特征
特征选择算法
冗余特征
验证算法
聚类
样本
特征数
输出特征
条目
鲁棒性
顶点
索引
标签
指标
元素