摘要
本发明公开了一种基于集成学习与主动学习的网络钓鱼页面识别方法,包括:收集网络页面并处理为初始数据集;对初始数据集聚类,构建簇集合;对簇集合中的簇训练单类宽度学习系统,分配权重构建第一集成学习模型;设立缓冲区暂存无法识别的页面,并聚类后识别类型,再训练单类宽度学习系统加入第一集成学习模型,形成第二集成学习模型;设计权重调整机制,适应钓鱼页面变化;利用第二集成学习模型对页面进行识别,若失败则送至缓冲区;若成功则计算置信度分数,并选择最高分数的数据标签来确定页面是否为钓鱼页面。本发明能够减少钓鱼页面识别过程中专业人员的参与,并保持优秀的识别成功率,为网络安全领域提供了一种有效的解决方案。
技术关键词
宽度学习系统
集成学习模型
钓鱼页面识别方法
重构误差
DBSCAN密度聚类
识别置信度
代表
页面数据
数据标签
主动学习策略
节点
应对网络攻击
识别成功率
网页页面
噪声数据
算法
列表
系统为您推荐了相关专利信息
脑电图数据
小波阈值降噪
识别系统
特征提取单元
降噪模块
指标
深度神经网络模型
非线性特征提取
评定系统
评定方法