一种基于BERT-CNN和分层注意力机制的恶意URL检测方法

正文

推荐专利

申请号：CN202510540987

申请日期：2025-04-27

公开号：CN120408618A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了基于BERT‑CNN和分层注意力机制的恶意URL检测方法，包括以下步骤：S1、获取URL数据集，将URL数据集分为恶意URL、正常URL数据集，整理并分析数据特征；S2、通过对样本数据进行预处理，将数据集细化为训练集、测试集以及验证集，并对不平衡数据进行处理；S3、进行特征提取，使用BERT模型将文本转换为数值特征；S4、分别部署融合注意力机制和卷积神经网络的算法、融合注意力机制和门控循环单元的算法、融合注意力机制和长短时记忆网络算法模型，将处理过的样本数据输入模型进行训练；S5、通过评估指标对模型进行评估，判断模型是否能够准确识别恶意URL和正常URL。本发明能够解决传统模型处理URL数据时可能丢失重要局部特征，通过词级别注意力捕捉URL关键子词重要性以及句子级别注意力整合整个URL语义结构，通过动态权重分配降低噪声部分的注意力权重。

技术关键词

URL检测方法分层注意力融合注意力机制分析数据特征 BERT模型预测类别门控循环单元上下文语义信息反向传播方法算法模型动态权重分配文本参数语义结构训练集网络

系统为您推荐了相关专利信息

基于检索增强的程序缺陷自动修复方法、系统、设备及可读存储介质

模板补丁标识符语义列表

基于质量证明的生成式模型区块链推理部署方法和系统

编码器加密区块链架构 BERT模型模块

一种航空安全热点事件的开放域多模态识别方法

模态识别方法事件过滤器热点文本分类器

一种商业地产运营敏捷匹配方法与系统

语义向量商铺多维特征向量融合语义多层感知机

跨模态检索方法、装置、电子设备及存储介质

跨模态检索方法交叉注意力机制文本编码器图像编码器教师

一种基于BERT-CNN和分层注意力机制的恶意URL检测方法

站点导航

APP 下载