摘要
本发明属于安全技术领域,提供了一种基于BERT和代码片段理解的二进制漏洞检测方法及系统。主旨在于解决二进制漏洞识别的问题,以及现有基于LSTM方法在精度上、粒度上的局限性。主要方案首先,通过Binary Ninja二进制代码的每个函数转化为一种中间表示MLIL;然后,对于中间表示中可能的漏洞点进行代码片段提取;接着,使用BERT模型对代码片段进行特征提取,得到具有代码片段语义的代码片段向量;最后使用多层感知机对代码片段向量进行分类,判定该代码片段是否包含漏洞。
技术关键词
二进制漏洞
语句
表达式
列表
序列
多层感知机
BERT模型
扫描算法
变量
定义
内存
处理单元
特征提取模块
标记单元
语义
子模块
插件