摘要
本发明涉及一种基于大模型微调的网络流量生成方法,与现有技术相比解决了蜜罐流量缺乏跨协议通用性、生成效果不佳的缺陷。本发明包括以下步骤:专业知识预处理与微调训练数据集的构建;ByT5模型的设定;基于ByT5模型的双阶段微调;流量生成结果获得。本发明采用了ByT5模型摆脱token的限制直接对字节进行处理,采用迭代调整微调数据集大小保证数据量合适避免欠拟合与过拟合,使用多种新颖的评估方法提高了模型微调的效果,将强化学习融入微调过程从而进一步提高模型的生成精度,可以有效地生成蜜罐所需的各式流量。
技术关键词
网络流量生成方法
专业知识库
图谱
注意力机制
解码器
自然语言
训练数据量
周期
训练器
前馈神经网络
编码器
蜜罐
实体
掩码矩阵
序列
格式
处理器
生成规则
系统为您推荐了相关专利信息
指令转换方法
特征向量空间
注意力神经网络
递归神经网络模型
指令执行单元
异常检测系统
样本
异常检测方法
图像编码器
多模态
索引
查验终端
信息查验方法
关键词
PageRank算法
打印机
体构建方法
数字孪生
动态数据库
训练卷积神经网络模型