摘要
本发明涉及一种基于预训练大语言模型的加密网络流量分类方法,属于加密网络流量分类技术领域。该方法主要包括三个阶段:预训练阶段,原始加密网络流量数据经过预处理转换为双字节十六进制格式,并利用字节对编码算法生成并优化基础词汇表,随后构建大语言模型并通过分布式训练得到预训练模型。再训练阶段,数据经过头字节洗牌处理,对预训练模型进行快速再训练以提升泛化能力。微调阶段,待分类数据经过预处理生成带标签的十六进制双字节数据,利用再训练后的模型进行分类任务训练,得到加密网络流量分类微调模型及分类准确率。通过预训练与再训练的结合,并借助数据分类微调预训练模型,实现了对复杂加密网络流量的高效处理与精准分类。
技术关键词
加密网络流量
大语言模型
分类方法
预训练模型
算法模型
数据分类
多头注意力机制
洗牌
编码算法
分布式训练
分类准确率
双向注意力机制
训练深度学习模型
分词
标签
阶段
线性变换矩阵
数据包特征
系统为您推荐了相关专利信息
避碰决策方法
大语言模型
空间约束条件
环境感知数据
智能船舶
智能问答方法
大语言模型
数据库查询语句
查询关键词
财务
能耗预测模型
能耗预测方法
公交车
双向变换器
大语言模型