摘要
本发明公开了一种扰动模式递增的毒性数据持续检测方法及系统,包括:获取待检测文本,采用毒性数据越狱扰动框架对所有待检测文本进行不同模式的扰动,得到各扰动模式下的越狱待检测困难文本,并构建各扰动模式下的数据集,且将数据集划分为训练集、验证集和测试集;构建基于特征回放的毒性持续检测模型,采用各扰动模式下的训练集训练毒性持续检测模型并采用验证集进行验证,得到最优的毒性持续检测模型;将各扰动模式下的测试集送入最优的毒性持续检测模型中进行检测,得到相应的毒性检测结果。本发明提出了越狱扰动框架生成不同扰动模式下的数据集,并提出了基于特征回放的持续学习方法,有效促进了对不同扰动模式下毒性文本的持续检测能力。
技术关键词
字词
文本
模式
样本
预训练语言模型
数据
训练集
字符
持续学习方法
模块
分类器
标签
框架
检测器
词语
度量
视觉
策略
典型
系统为您推荐了相关专利信息
时间序列模型
评估桥梁状态
识别方法
时间序列特征
桥梁监测信号
动态知识图谱
故障诊断算法
生成方法
文本
推理机制
保护数据隐私
大语言模型
令牌
生命周期管理
加密
数据管理方法
存储装置
差分隐私技术
去重算法
数据迁移