摘要
本发明提出基于多模态特征融合的二进制代码相似性检测方法与系统,属于网络安全技术领域。在所述方法中,利用程序分析方法,从二进制文件中提取反汇编代码作为文本序列特征,提取控制流图作为拓扑图结构特征;针对文本序列特征和拓扑图结构特征两种不同的模态,分别使用不同的表征模型进行嵌入表征;使用多模态融合表征模型对不同模态的嵌入表征向量进行融合处理并生成经融合的嵌入表征向量;基于经融合的嵌入表征向量,结合向量距离计算公式来检测相似程度,根据预设阈值完成相似性检测。本发明解决二进制代码相似性检测方法特征层面使用不完全,导致检测准确率较低、检测场景泛化能力弱的问题。
技术关键词
二进制代码相似性检测方法
序列特征
多模态特征融合
拓扑图
文本
程序分析方法
深度学习模型
处理单元
代码转换
分析工具
注意力机制
网络安全技术
可读存储介质
编码器
电子设备
处理器
存储器
计算机
系统为您推荐了相关专利信息
门控循环神经网络
多尺度
重构模块
文本
特征提取网络
视频内容生成方法
上下文特征
语句
图像
语义向量
视频情感分析方法
情感分析模型
多模态
教学
学生
多模态信息
推荐系统
模态特征
局部纹理特征
上下文环境信息
深度卷积神经网络模型
序列特征
浅层特征提取
深层特征提取
Softmax函数