一种基于深度学习的有害网站识别方法及装置

正文

推荐专利

申请号：CN202410792877

申请日期：2024-06-19

公开号：CN118364190B

公开日期：2024-09-24

类型：发明专利

摘要

本发明公开了一种基于深度学习的有害网站识别方法及装置，所述方法包括：爬取和收集现有有害网站的特征数据，并建立有害网站的特征数据库；将特征数据库及其对应的标签输入到预训练模型中，分别训练得到有害检测模型和有害分类模型；对于互联网流量中提取到的域名或IP爬取其网站特征信息数据；将网站特征输入到已训练的检测模型中，得到第一研判结果；若第一研判结果为正常，则根据特征数据判断是否为仿冒网站；若第一研判结果为异常，则将网站特征信息输入到有害分类模型中，得到网站的具体有害类型。本发明通过基于深度学习的分级模型分别对网站进行有害检测和识别，从而可以准确地实现对有害网址的有害分析研判。

技术关键词

网站识别方法网站特征特征数据库网页快照文本静态方式网站识别装置网址互联网标签处理器可读存储介质存储器训练集指令语义计算机动态

系统为您推荐了相关专利信息

基于自然语言对话实现运维服务集成的方法、装置、处理器及其计算机可读存储介质

自然语言计算机可执行指令多轮对话大语言模型关键字

视频生成方法、装置、电子设备及可读存储介质

视频生成模型运动特征注意力样本文本

基于人工智能大模型生成低代码界面的方法、计算机装置及计算机可读存储介质

解析插件计算机装置生成前端代码界面文本

一种语言科技资源的数据密级智能管理方法

智能管理方法 BERT模型科技资源数据

一种大语言模型驱动的结构化数据交互提取与变换系统及其方法

表格大语言模型非结构化文本主题代表

一种基于深度学习的有害网站识别方法及装置

站点导航

APP 下载