摘要
本公开提供了一种网站识别方法、装置及电子设备,获取待测网站的统一资源定位符信息,根据所述统一资源定位符信息对所述待测网站进行协议探测处理,确定所述待测网站的生存状态;响应于所述待测网站的生存状态为存活状态,确定所述待测网站的目标特征数据;获取预设的显性特征,利用所述显性特征对所述目标特征数据进行特征匹配,得到匹配结果;响应于所述匹配结果为匹配成功,确定所述待测网站对应的注册页超文本标记数据;响应于所述注册页超文本标记数据中存在预设异常信息,确定所述待测网站为目标网站,记录所述待测网站。本公开提高了对于待测网站是否为涉诈网站的判断准确性,进而提高了后续涉诈网站模型训练数据集的质量。
技术关键词
统一资源定位符
网站识别方法
标记
异常信息
文档对象模型
网站识别装置
脚本
超文本传输协议
图标
电子设备
数据获取模块
匹配模块
处理器
存储器
系统为您推荐了相关专利信息
注视点
眼动数据
计算机可执行指令
眼动识别方法
位置提取
自动驾驶功能
驾驶舱
异常信息
系统状态管理
模块