摘要
本发明公开了一种网络攻击识别模型的训练数据生成方法及装置、电子设备,涉及网络安全领域,其中,该方法包括:从多个信息源收集待识别邮件,对预处理后的待识别邮件进行分类处理和标注处理,得到标注邮件样本集,提取内容特征、发件人特征、结构特征和附件特征,得到样本特征集合,利用生成对抗网络模型进行数据合成,生成合成邮件样本,将标注邮件样本以及合成邮件样本转换为预设模型数据格式,生成模型训练数据集,对预设大语言模型进行训练,通过模型识别往来邮件是否为钓鱼邮件。本发明解决了相关技术中识别钓鱼邮件的模型未能及时更新识别攻击方式的训练数据,容易造成邮件过滤出现疏漏,影响用户满意度的技术问题。
技术关键词
训练数据生成方法
钓鱼邮件
大语言模型
网络攻击识别
样本
附件特征
生成对抗网络模型
邮件正文
统一资源定位
数据格式
网络安全服务器
路径结构
文本
监督学习算法
数据生成装置
邮件网关
邮件服务器
特征提取单元
系统为您推荐了相关专利信息
时空预测方法
转移概率矩阵
梯度提升决策树
土地利用数据
元胞自动机模型
图像分类模型
待检对象
视频
计算机程序指令
人脸关键点识别
分布设计方法
声纳设备
组合式传感器
定位技术
识别神经网络
交互式数字
生成对抗网络
多模态数据库
混合聚类算法
多模态数据采集