摘要
本发明公开了一种基于语义嵌入向量生成模型的代码嵌入方法,属于计算机技术领域,包括以下步骤:获取二进制代码块并进行反汇编处理和基于不同粒度的代码结构分析,以得到二进制代码块对应的基本块以及控制流图结构特征;基于二进制代码块对应的基本块以及控制流图结构特征进行汇编指令线性转化和跨指令集语义嵌入转化,以生成跨指令集架构对应的统一二进制代码语义嵌入向量空间;获取已知漏洞样本并进行语义漏洞表征分析和候选漏洞检索定位,以生成候选漏洞代码块集合;对候选漏洞代码块集合进行动态分析验证并识别出对应的漏洞修复状态,以输出对应的二进制漏洞代码块检测报告。本发明能够实现二进制代码的高精度语义嵌入。
技术关键词
二进制漏洞
嵌入方法
机器翻译模型
代码结构
独立语义
代码执行漏洞
自然语言
线性
序列
动态
样本
语义向量空间
条件分支指令
无监督学习
漏洞特征
关系
可读存储介质
系统为您推荐了相关专利信息
集成测试方法
机器学习算法分析
优化测试顺序
集成测试系统
故障树分析技术
智能可视化
查询意图
多模态
决策系统
知识图谱嵌入方法
语音翻译方法
多语言
低资源语言
神经网络架构
机器翻译技术