摘要
本发明涉及一种基于代码语义和文本嵌入的混淆Android恶意应用的检测方法,包括以下步骤:收集恶意软件数据集;对数据集中恶意软件进行混淆;提取权限和控制流程图中API调用特征;将特征使用BERT预训练模型进行嵌入并结合聚类算法对特征进行过滤;对API调用特征进行编码;搭建深度学习框架,框架里面训练所采用的深度学习模型为模型BERT+Self‑Attention+TextCNN模型;重复多次迭代得到最终的预测效果。本发明使用了代码语义和文本嵌入并结合聚类算法,通过训练改进的预训练模型,能够显著提高混淆恶意软件分类的鲁棒性。
技术关键词
恶意软件数据
Android恶意软件
三元组
恶意软件检测
文本
深度学习模型
Attention机制
权限特征
聚类算法
噪声特征
样本
注意力机制
语义特征
实体
训练集
深度学习框架
全局平均池化
预训练模型
系统为您推荐了相关专利信息
文本信息提取方法
照片
项目
校验规则
大语言模型