基于CNN+BERT的恶意网址检测分类模型的训练及检测方法

正文

推荐专利

申请号：CN202410905401

申请日期：2024-07-08

公开号：CN118445802B

公开日期：2024-09-03

类型：发明专利

摘要

本发明公开了一种基于CNN+BERT的恶意网址检测分类模型的训练及检测方法，涉及互联网网络安全技术领域，基于CNN+BERT的恶意网址检测分类模型的训练方法包括：收集网页数据构建数据集；利用词向量模型对所有URL的词元进行处理，构建URL的字符词典，得到各个URL的编码向量即句向量；将URL句向量通过CNN网络进行自适应特征提取；对数据集中的网页文本进行编码，获取文本向量，将文本向量通过BERT模型获取网页文本特征向量；将URL特征向量与网页文本特征向量进行拼接获取网址的预测输出，将URL视作文本信息进行特征提取，对URL的语义挖掘提升了精准性，结合了CNN和BERT，提取出更加丰富和有效的特征表示，提高了网址检测的准确率。

技术关键词

检测分类模型文本特征向量网址 BERT模型字符词典词向量模型编码向量数据分词矩阵编码器索引参数可调标签滑动窗口网络

系统为您推荐了相关专利信息

基于三维数字仿真模型的组塔施工管理系统及方法

结构风险评估数字仿真模型施工管理方法三维仿真模型风险评估值

基于多模态用户画像的司机雷达图构建方法及系统

非结构化文本多模态司机雷达画像

基于人工智能的无代码应用生成方法及系统

生成方法指数衰减函数计算机程序指令输入接口前端模块

一种基于商品问卷评论文本的词云生成方法及装置

分词生成方法有效性生成评论文本 BERT模型

一种基于学科知识图谱的教学方法、装置及存储介质

学科知识图谱光学字符识别技术教学方法数据切片

基于CNN+BERT的恶意网址检测分类模型的训练及检测方法

站点导航

APP 下载