摘要
本发明提供一种基于深度学习和代码切片的行级别漏洞检测方法及装置,包括:对CVE漏洞代码进行切片,提取易受攻击的代码行的位置信息;利用BPE子词标签化方法,提取源代码中的常用词,利用常用词生成体量较小的代码嵌入;基于Bert构造深度学习模型,选用microsoft/codebert提供的初始权值,使用漏洞代码数据结合位置信息使模型更关注于漏洞相关代码特征,得到训练好的权重;加载训练过程的得到的权重数据,对待测代码进行函数级和语义行级别的漏洞检测,预测源文件以及各行代码中是否存在漏洞。本发明提供的基于深度学习和代码切片的行级别漏洞检测方法及装置,通过将transformer中位置编码与漏洞代码行位置信息结合,使模型更加关注漏洞相关代码特征,大大提高了模型的预测准确性和泛化性。
技术关键词
代码切片
漏洞检测方法
代码特征
深度学习模型
注意力
抽象语法树
标记
漏洞检测装置
关键词
模型训练模块
标签
阶段
语义特征
变量
数据
网格
补丁
系统为您推荐了相关专利信息
特征融合方法
动态
多尺度特征融合
广角摄像头
网格