一种数据增强方法和装置

正文

推荐专利

一种数据增强方法和装置

申请号：CN202411516698

申请日期：2024-10-29

公开号：CN119337889A

公开日期：2025-01-21

类型：发明专利

摘要

本申请提供一种数据增强方法和装置，应用于网络安全技术领域，用于对测试集进行有效的数据增强，提高仿写文本的丰富性和适用性。该方法包括获取多个待检测文本；将每个待检测文本输入到大语言模型中进行处理，获取大语言模型输出的每个待检测文本的答复文本；按照第一预设规则对每个待检测文本的答复文本进行评估，得到每个待检测文本的第一评分；将每个待检测文本输入到评测模型中进行处理，获取评测模型对每个待检测文本的第二评分；基于每个待检测文本的第一评分和第二评分确定每个待检测文本的有害评分；获取有害评分大于预设阈值的至少一个待检测文本；对至少一个待检测文本进行仿写，得到至少一个仿写文本。

技术关键词

文本大语言模型句法结构主题网络安全技术存储程序指令可读存储介质计算机语义数据模块存储器逻辑电子设备处理器

系统为您推荐了相关专利信息

一种融合近义词与大语言模型的档案开放审查辅助判断方法

辅助判断方法 Word2Vec模型分词大语言模型引入注意力机制

文本区域的确定方法、装置、电子设备和存储介质

卷积神经网络模型文本图像条件随机场模型样本

一种基于深度学习的商标图像检索方法及系统

商标图像检索方法语义向量实体链接技术知识图谱推理文本

一种基于数据对齐的大语言模型回复生成方法及系统

回复生成方法大语言模型数据对齐模块样本生成系统

测试用例评价模型的训练及应用方法、系统、设备及介质

自然语言文本无标签数据模板深度学习模型训练可读存储介质

一种数据增强方法和装置

站点导航

APP 下载