摘要
本发明涉及一种抗概念漂移的敏感应用识别及流量数据处理方法,包括:采集多个流量会话样本形成第一训练集;以第一训练集中样本对ET‑BERT模型进行二次预训练;将多个敏感应用类型已知的流量会话样本输入二次预训练好的模型得到输出向量vi,将输出向量vi、敏感应用类型存储至向量数据库;定期采集新的敏感应用类型已知的流量会话样本对向量数据库进行更新;将待识别敏感应用的流量会话样本的令牌序列输入二次预训练好的模型,得到输出向量u;基于输出向量u与向量数据库的输出向量及其对应的敏感应用类型确定待识别敏感应用的类型;对识别出类型的敏感应用的流量数据进行监控,当流量数据满足预设条件时对所述敏感应用的流量数据进行处理。
技术关键词
流量数据处理方法
令牌
BERT模型
会话
样本
序列
还原数据
训练集
概念
滑动窗口
度函数
端口
服务端
系统为您推荐了相关专利信息
人工智能模型
稳定性评估方法
指标
样本
校准误差