摘要
本发明提供一种二进制文件相似检测方法、装置、设备、介质及程序产品,方法包括:对待检测二进制文件包含的函数进行划分得到基本块,对基本块内的指令序列进行语义提取,得到基本块的语义特征;基于结构特征和语义特征构建函数的控制流程图CFG;将函数的控制流程图输入图嵌入自动编码器GAE改进模型,得到待检测二进制文件的相似度;GAE改进模型是基于具有结构特征和语义特征的CFG矩阵训练得到的。通过准确获取待检测二进制文件的语义特征和结构特征,将语义特征和结构特征融合构建的控制流程图输入改进后的图嵌入自动编码器模型。从多种特征中综合评估二进制文件的相似度,提高了二进制文件相似度检测的准确性。
技术关键词
自动编码器
循环神经网络方法
矩阵
指令
语义特征提取
长短期记忆网络
序列
处理器
计算机程序产品
注意力机制
存储器
节点
电子设备
模块
介质
关系
系统为您推荐了相关专利信息
水印
图像特征信息
视频
语音特征信息
语音信号特征
高海拔
DBSCAN算法
归一化植被指数
地形特征
分类器