摘要
本发明公开了一种基于深度学习的有害网站识别方法及装置,所述方法包括:爬取和收集现有有害网站的特征数据,并建立有害网站的特征数据库;将特征数据库及其对应的标签输入到预训练模型中,分别训练得到有害检测模型和有害分类模型;对于互联网流量中提取到的域名或IP爬取其网站特征信息数据;将网站特征输入到已训练的检测模型中,得到第一研判结果;若第一研判结果为正常,则根据特征数据判断是否为仿冒网站;若第一研判结果为异常,则将网站特征信息输入到有害分类模型中,得到网站的具体有害类型。本发明通过基于深度学习的分级模型分别对网站进行有害检测和识别,从而可以准确地实现对有害网址的有害分析研判。
技术关键词
网站识别方法
网站特征
特征数据库
网页快照
文本
静态方式
网站识别装置
网址
互联网
标签
处理器
可读存储介质
存储器
训练集
指令
语义
计算机
动态
系统为您推荐了相关专利信息
自然语言
计算机可执行指令
多轮对话
大语言模型
关键字