摘要
本发明涉及一种基于AST增强二进制代码相似性检测方法及系统,包括了采用深度优先算法对抽象语法树进行遍历,从中筛选出对程序控制流和逻辑结构具有关键作用的节点,对于筛选得到的关键节点构建AST,得到AST语义特征;基于跳转感知机制提取二进制代码的控制流特征,并根据函数执行微迹提取二进制代码的行为特征;采用通道注意力机制对AST语义特征、控制流特征、行为特征进行特征融合;采用融合后的特征检测二进制代码的相似性。本发明提出了新的混合架构模型SemASTer,集成了Tree‑LSTM和Transformer,以增强对AST中的深层次语义的理解;而且引入了通道注意力机制,能够高效结合基于语法特征的方法和基于行为特征的方法。
技术关键词
二进制代码相似性检测方法
语义特征
通道注意力机制
深度优先算法
加权特征
节点
抽象语法树
深度优先搜索
LSTM模型
标记
语法特征
特征提取模块
编码
矩阵
逻辑
指令
系统为您推荐了相关专利信息
语义分割方法
多帧图像数据
多模态特征融合
子模块
蒸馏