摘要
本发明属于恶意代码检测领域,提供了一种基于机器学习和群智能算法的恶意代码分类方法,此方法包括以下步骤:S1、数据预处理;S2、特征融合与选择;S3、模型训练与分类;本发明通过融合不同n值的n‑gram特征进行恶意代码分类,和基于单一n值的分类方法相比,准确率、精确率、召回率和F1‑score四项指标均有提高,通过采用改进的离散二进制粒子群算法对融合后的特征进行进一步选择,在提高分类精度的同时,大幅减少了特征量,提高了模型运行速度。
技术关键词
恶意代码分类方法
二进制粒子群算法
智能算法
随机森林
引入遗传算法
归一化方法
速度
数据
分类器
序列
决策
训练集
社会
数值
指标