摘要
本申请实施例公开了一种钓鱼网站检测方法、装置、电子设备及介质,通过提取目标网站的第一HTML文档的结构信息特征向量和内容信息特征向量,并拼接得到目标网站的第一特征向量,以及提取可疑网站的第二HTML文档的结构信息特征向量和内容信息特征向量,并拼接得到可疑网站的第二特征向量;根据该第一特征向量和第二特征向量,通过预先训练完成的预测模型,进行钓鱼网站的检测。相比于仅依赖于网站页面中展示的内容进行钓鱼网站的检测来说,本申请通过分别对HMTL文档的结构信息和内容信息进行特征向量的提取以及计算,确保了模型能够全面捕捉网站整体特征,从而提高了钓鱼网站检测的准确性。
技术关键词
节点
长短期记忆模型
钓鱼网站检测方法
卷积模型
超文本标记语言
编码器
统一资源定位
遍历算法
深度卷积神经网络
标签
电子设备
图像
处理器
字符
可读存储介质
本子
机制