摘要
本发明涉及一种基于行为特征文本嵌入和迁移学习的未知Andro id恶意应用的检测方法,包括以下步骤:收集真实世界未知恶意软件数据集以及已有公开数据集;提取权限、API调用和URL特征;结合预设行为描述模板生成行为描述特征;对行为描述特征进行嵌入;结合相似度量剔除恶意软件行为描述特征中的非恶意行为;使用已有数据集训练LSTM神经网络并结合L1正则化和堆叠自编码器对模型进行泛化能力增强;输入未知恶意软件数据集到模型中进行检测;重复多次迭代得到最终的预测效果。本发明使用了行为特征文本嵌入和迁移学习并结合NLP,通过增强已有数据集训练出的模型的泛化能力,能够显著提高对未知恶意软件分类的鲁棒性。
技术关键词
恶意软件数据
文本
恶意样本
权限特征
LSTM神经网络
模板
重构
编码器
鲁棒性
度量
语义
冗余
符号
定义