摘要
本发明提供的基于GNN的跨架构二进制程序相似性检测方法、装置及设备,涉及信息安全处理技术领域。本发明通过获取待检测的两份二进制程序,并反汇编为低级虚拟机中间表示LLVM IR;基于LLVM IR构建程序图;然后将所述程序图输入FastText模型提取出LLVM IR指令,并基于LLVM IR指令创建的语料库作为FastText模型的词汇表进行多轮训练,以将指令标记表示为连续向量空间中的词向量,生成指令向量;根据所述程序图和所述指令向量,利用全局注意力增强的图神经网络GNN进行处理,以生成固定维度的图嵌入向量;计算两份二进制程序对应的图嵌入向量之间的相似性以评估相似度。本发明能实现跨架构二进制程序的统一程序表示,捕获高层语义特征,有效提高大规模程序库分析的处理效率。
技术关键词
相似性检测方法
程序
数据依赖关系
多头注意力机制
生成指令
相似性检测装置
节点特征
高层语义特征
神经网络单元
标记
卷积模块
邻居
样本
编码
检测设备
存储器
系统为您推荐了相关专利信息
图像识别方法
专用标签
文本
训练特征融合
注意力
代码保护方法
随机存储器
哈希算法
服务器
非易失性存储器