摘要
本发明公开了一种在线漂移检测和自适应的可持续网络流量分类方法,首先构建原始模型,完成流量数据工程和流量特征工程,并训练分类模型;然后进行漂移检测,通过漂移检测器检测网络流量数据是否发生漂移,若数据发生漂移,采集变化后的网络流量作为新数据,使用改进的旧知识蒸馏和偏差校正方法,进行数据漂移后的持续学习;最后,用调整后的新模型替代旧模型,完成网络流量数据漂移后模型自动检测和更新。本发明方法能够实时监测网络流量数据的变化,及时发现数据漂移的发生,并使用合适的更新策略快速适应新的数据分布,保持良好的性能;同时考虑数据选取和存储,减小了存储所有数据造成的资源浪费,提高了更新模型的实时性和灵敏度。
技术关键词
网络流量分类方法
网络流量数据
偏差校正方法
检测网络流量
概率密度函数
集群
数据分布
训练分类模型
样本
更新模型参数
特征工程
模型更新
在线
识别流量数据
监测网络流量
内存
检测器
蒸馏