摘要
本发明涉及一种融合恶意词典与Bert预训练模型的恶意URL检测方法,属于信息安全技术领域。该方法包括:采集恶意词汇构建恶意词典,并获取URL页面文本信息,对其进行预处理后构建URL页面文本内容数据集;构建融合恶意词典与Bert预训练模型的文本内容检测网络,利用Bert预训练模型对文本进行特征提取,生成包含上下文信息的文本向量;通过恶意值计算模块得到文本序列的恶意权重向量,进而得到文本向量的恶意加权向量;将恶意加权向量经过多尺度卷积模块,提取不同尺度下的特征并生成多尺度特征向量,并计算恶意概率,从而检测恶意URL。本发明显著增强了恶意URL检测的精确度与稳定性,为信息安全提供了更强的防护。
技术关键词
URL检测方法
词典
Softmax函数
Softmax分类器
卷积模块
页面文本信息
词语
Word2Vec模型
生成多尺度
Sigmoid函数
注意力
矩阵乘法运算
通道
信息安全技术
网络
编码
系统为您推荐了相关专利信息
光纤非线性补偿
神经网络优化方法
注意力
神经网络模型训练
序列
实例分割方法
体积医学图像数据
实例分割模型
梯度下降算法
多尺度特征
人体关键点
识别方法
社会
卷积模块
特征提取网络