摘要
本发明公开了钓鱼文档解混淆和特征提取方法及其在攻击检测中的应用,其中解混淆包括获取钓鱼文档的混淆宏代码,利用预训练语言模型构建提示工程模板,分析混淆逻辑结构并生成解混规则与还原策略;通过解析工具将混淆宏代码结构化为抽象语法树,基于正则表达式匹配典型混淆模式,结合函数执行仿真与单元格引用分析,实现结构初步还原、控制流语义还原及操作路径构建;根据解混规则与抽象语法树,将混淆结构转换为可读宏语句,生成去除混淆语义的宏代码指令序列,输出解混后的语义序列。特征提取包括提取单词特征、Token特征、抽象语法树特征及关系特征。本发明突破传统钓鱼攻击检测和混淆文档难识别的瓶颈,提升钓鱼文档攻击的检测准确率。
技术关键词
解混淆方法
抽象语法树
文档特征提取
计算机系统执行
预训练语言模型
特征提取方法
攻击检测模型
深度神经网络
解析工具
序列
语义
局部特征提取
节点
指令
关系
Softmax函数
一维卷积神经网络
抑制噪声干扰
结构特征提取
系统为您推荐了相关专利信息
报告生成方法
预训练语言模型
风险点
意图识别
意图类别
预训练语言模型
核保方法
语义
布局
计算机程序产品
预训练语言模型
学习方法
多任务
算法
自动语音识别