一种融合URL字符和HTML内容语义的钓鱼网页检测方法

正文

推荐专利

申请号：CN202411849428

申请日期：2024-12-16

公开号：CN119652627B

公开日期：2025-10-21

类型：发明专利

摘要

本发明公开一种融合URL字符和HTML内容语义的钓鱼网页检测方法，基于多尺度卷积策略的URL字符级局部特征精细提取，利用不同尺寸卷积核的CNN并行处理URL字符串，提取不同粒度的特征，从而全面捕捉数据的多层次信息，增强模型对URL潜在威胁的敏感；基于级联密集连接CNN架构的HTML文本词级特征提取。通过堆叠多个卷积层并在卷积块之间建立密集连接，提取更深层次和细粒度的语义特征；通过全连接层将URL特征字符和HTML特征进行融合，并计算出相应的概率以判定其是否为钓鱼网页。本发明充分利用深度学习算法的优势，整合钓鱼网页的URL字符与HTML内容的特征，形成更为全面的语义表示，极大地提高了钓鱼网页检测的识别率。

技术关键词

钓鱼网页检测方法字符高维向量空间文本语义特征网络模块深度特征提取深度学习算法解析网页级联样本数据表达式融合特征脚本多层次索引

系统为您推荐了相关专利信息

车流量确定方法、电子设备、存储介质及计算机程序产品

路径地图节点终点路段字符

一种基于小样本分类的企业挂靠产业方法

标签文本原型样本企业编码器参数

一种数据处理方法及电子设备

图像生成模型文本生成模型多媒体音频生成指令

一种基于上下文适应器和偏置损失的语音识别方法及系统

语音识别模型多头注意力机制文本语音识别方法大规模语音数据

一种网络安全大模型知识库构建方法、设备及存储介质

知识库构建方法答案机器学习模型重构同义词

一种融合URL字符和HTML内容语义的钓鱼网页检测方法

站点导航

APP 下载