摘要
本发明涉及计算机程序检测技术领域,特别涉及一种基于反编译大模型和EAST特征的二进制程序漏洞检测方法及系统,使用漏洞函数数据集和系统调用函数数据集对预训练反编译大模型LLM4Decompile进行微调,使LLM4Decompile对反编译器Ghidra输出的反编译后的伪代码进行语法语义优化;对微调后反编译大模型语法语义优化后的反编译伪代码提取对应的增强型抽象语法树EAST,并对增强型抽象语法树利用EASTNN模型进行特征编码;将编码后待检测非混淆二进制程序、漏洞函数数据集的特征向量输入Siamese网络中进行相似性计算,根据相似性计算结果评估非混淆二进制程序漏洞。本发明通过使用微调后反编译大模型和增强型抽象语法树特征编码,提升了非混淆二进制程序漏洞检测的准确率和效率。
技术关键词
二进制程序漏洞
Siamese网络
系统调用函数
抽象语法树
计算机程序检测技术
语义
数据
编码模块
更新模型参数
梯度下降法
编码向量
可读存储介质
样本
编码器
字符
变量
系统为您推荐了相关专利信息
数据安全交换系统
攻击检测模型
多模态
访问控制模块
语义特征提取
工业控制系统
监控器
监控方法
时间管理器
工业控制对象