摘要
一种API语义矢量化Transformer恶意代码检测方法和系统。该方法包括,获取基于PE文件的恶意代码数据集,提取恶意代码数据集中恶意代码的API序列和MD5值,根据MD5值确定恶意代码家族标签;构建基于负采样优化的FastText词嵌入模型,基于FastText词嵌入模型将恶意代码的API序列生成词向量;使用BorederLine‑1SMOTE算法对恶意代码API向量进行过采样处理,通过合成类别边界的少数类样本进行数据平衡;构建Transformer恶意代码特征提取模型,对恶意代码API向量的恶意代码进行特征提取和语义分析;对Transformer恶意代码特征提取模型添加平均池化层和全连接层,构建恶意代码检测模型,实现恶意代码分类检测。本发明的方案提高了恶意代码的识别能力和检测性能。
技术关键词
恶意代码检测方法
恶意代码家族
特征提取模型
恶意代码分类
恶意代码检测系统
语义
序列
多头注意力机制
矩阵
扫描网站
数据
融合词向量
分词
标签
样本
前馈神经网络
特征提取模块
字符
系统为您推荐了相关专利信息
文档图像数据
文档修复方法
生成对抗网络模型
文档特征
图像特征数据
联合检测方法
图像特征向量
唾液
特征提取模型
多模态
神经网络模型
位点预测方法
节点
序列
非易失性计算机可读存储介质
分数阶神经网络
监测传感器
条件生成对抗网络
编码器
鲸鱼优化算法
特征提取模型
样本
真实性检测方法
标签
预测特征