摘要
本发明涉及一种优化机器学习的软件漏洞并行挖掘方法,属于漏洞挖掘领域。本发明将软件漏洞历史数据中漏洞代码函数、参数、目标变量等映射到符号名称域中,并对其归一化处理,建立由基类、子类、代码类组成的多类漏洞信息资源库,统一漏洞编码命名。使用机器学习中KNN算法深度聚类挖掘软件特征,并引入计算任意二者间欧式距离。将相似度最大特征所属关键节点定义为软件漏洞。本发明的方法特征分类精度较高,且软件漏洞挖掘的F1值可保持在0.88以上,挖掘误报率低;通过并行化工具运行,能够在特定场景下实现多种软件漏洞并行挖掘任务。
技术关键词
并行挖掘方法
优化机器学习
特征值
资源库
软件包
软件特征
节点
软件漏洞挖掘
挖掘算法
特征向量空间
KNN算法
变量
数据
扫描系统
非线性
聚类算法
参数
系统为您推荐了相关专利信息
综合评价系统
指标
评价层次模型
主客观融合
综合评价模型
电力负荷预测方法
鲸鱼优化算法
卡尔曼滤波
数据
电力负荷预测装置
系统密码
设备认证
同态加密算法
零知识证明机制
动态更新设备