摘要
基于思维链提示优化的大语言模型加密流量分类方法,属于网络安全技术领域,解决如何提高加密流量分类准确性的问题,本发明通过将包级和流级特征进行融合,得到流量特征融合序列作为训练数据,采用思维链蒸馏的方式,利用一个以少样本方式生成思维链的教师模型GPT‑4生成提示数据集,并用提示数据集微调学生模型llama‑3‑8b,且为学生模型训练新的流量领域分词器;本发明使用了流量数据包级和流级的融合特征,能够学习到加密流量的整体和局部特征;本发明训练生成了流量领域分词器,使模型更准确理解流量数据;本发明利用思维链蒸馏技术,增强了模型的逐步推理能力,使模型更具有可解释性。
技术关键词
加密流量分类方法
标签
大语言模型
损失函数设计
字符
网络流量数据
学生
教师
网络安全技术
序列
蒸馏
处理器
变量
融合特征
存储器
样本
词典
电子设备