摘要
本发明公开了基于语义增强抽象语法树的跨编程语言恶意代码检测方法及系统,涉及网络空间安全技术领域,通过Tree‑Sitter对源代码进行语法解析,生成与编程语言无关的标准化抽象语法树并采用语义节点筛选算法进行剪枝优化,生成语义增强抽象语法树,递归遍历语义增强抽象语法树提取语义增强抽象语法树节点序列;利用子词编码模型对语义增强抽象语法树节点序列进行跨语言统一处理,通过字节对编码算法构建共享词表,生成预设维度的定长语义特征向量并输入TextCNN模型提取分类特征向量,再输入多分支Softmax分类器,根据输入语言标记符自动路由至对应分支,生成检测结果。本发明实现多编程语言恶意代码统一检测,通过语义增强与自适应机制显著提升跨语言适应性,有效克服语义表征与跨语言适应性瓶颈,在抗混淆与对抗样本场景中保持稳定检测能力。
技术关键词
抽象语法树
恶意代码检测方法
Softmax分类器
筛选算法
节点
编码算法
多分支
输入多尺度
语义特征
分词模型
序列
深度特征提取
多语言
文件扩展名
解析器
标记
池化特征
语法结构
系统为您推荐了相关专利信息
测试序列生成方法
神经网络参数
待测系统
元素
遗传算法
微带带阻滤波器
高通滤波电路
运算放大器
低通滤波电路
输入端