摘要
本发明提出了一种基于预训练模型的多模态二进制相似性漏洞检测方法。本发明以Electra‑small模型为基础架构,首先将二进制代码反编译为伪代码,并生成对应的代码属性图,接着将代码属性图转换为包含结构信息的序列与伪代码一同输入模型进行预训练;接着本发明为模型设定了三个预训练目标,包括替换词检测、代码属性图边预测与多模态对比学习,使模型在大量数据上学习输入的普遍特征;最后,本发明在漏洞检测任务上对预训练模型进行微调。相对于其他二进制漏洞检测方法,本发明使用伪代码与代码属性图的多模态对比学习检测方法能够缓解编译多样性的影响,且具有更低漏报率。
技术关键词
漏洞检测方法
预训练模型
样本
序列
数据生成器
多模态
学习检测方法
二进制漏洞
开源项目
控制结构
指令
标签
编码器
策略
标识
代表
系统为您推荐了相关专利信息
搜索算法
多任务
生物遗传学技术
非暂态计算机可读存储介质
基因
暂态稳定评估
静止同步补偿器
注意力机制
虚拟同步发电机模型
控制策略
氧枪
特征工程
冶金工业自动化技术
场景
统计特征