一种融合URL字符和HTML内容语义的钓鱼网页检测方法

AITNT
正文
推荐专利
一种融合URL字符和HTML内容语义的钓鱼网页检测方法
申请号:CN202411849428
申请日期:2024-12-16
公开号:CN119652627B
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开一种融合URL字符和HTML内容语义的钓鱼网页检测方法,基于多尺度卷积策略的URL字符级局部特征精细提取,利用不同尺寸卷积核的CNN并行处理URL字符串,提取不同粒度的特征,从而全面捕捉数据的多层次信息,增强模型对URL潜在威胁的敏感;基于级联密集连接CNN架构的HTML文本词级特征提取。通过堆叠多个卷积层并在卷积块之间建立密集连接,提取更深层次和细粒度的语义特征;通过全连接层将URL特征字符和HTML特征进行融合,并计算出相应的概率以判定其是否为钓鱼网页。本发明充分利用深度学习算法的优势,整合钓鱼网页的URL字符与HTML内容的特征,形成更为全面的语义表示,极大地提高了钓鱼网页检测的识别率。
技术关键词
钓鱼网页检测方法 字符 高维向量空间 文本 语义特征 网络模块 深度特征提取 深度学习算法 解析网页 级联 样本 数据 表达式 融合特征 脚本 多层次 索引
系统为您推荐了相关专利信息
1
车流量确定方法、电子设备、存储介质及计算机程序产品
路径地图 节点 终点 路段 字符
2
一种基于小样本分类的企业挂靠产业方法
标签文本 原型 样本 企业 编码器参数
3
一种数据处理方法及电子设备
图像生成模型 文本生成模型 多媒体 音频 生成指令
4
一种基于上下文适应器和偏置损失的语音识别方法及系统
语音识别模型 多头注意力机制 文本 语音识别方法 大规模语音数据
5
一种网络安全大模型知识库构建方法、设备及存储介质
知识库构建方法 答案 机器学习模型 重构 同义词
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号