基于模拟训练的自然语言处理模型后门防御方法及系统

正文

推荐专利

申请号：CN202510486069

申请日期：2025-04-17

公开号：CN120561916A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种基于模拟训练的自然语言处理模型后门防御方法及系统，本发明包括从中毒的自然语言处理数据库中读取中毒数据集合，再进行标签平衡和噪声注入得到高噪声中毒数据集合，并对预设的自然语言处理模型通过模拟训练进行学习行为建模得到毒性揭露的数据集合；若建模质量是否满足要求则返回重新生成，否则利用毒性揭露的数据集合训练预设的自然语言处理模型，得到完成后门防御训练的、干净的自然语言处理模型以用于针对输入的文本获得对应的标签。本发明旨在解决现有基于数据或模型删除的后门防御方法可能损失关键信息导致后门防御性能下降的问题，提升自然语言处理模型的后门防御性能。

技术关键词

后门数据标签噪声文本样本概率密度函数自然语言模型微处理器可读存储介质防御系统计算机程序产品编程表达式指令上采样指数

系统为您推荐了相关专利信息

推荐方法、装置、设备、介质和产品

大语言模型推荐方法标识样本推荐意图

基于知识迁移框架的跨城市交通状态预测方法

嵌入特征网格地图城市交通状态预测特征提取模块更新模型参数

备电系统、方法、装置、设备、介质及计算机程序产品

供电故障基板管理控制器电源模组非易失性存储设备可编程逻辑器件

车辆轨迹预测方法、装置和车辆

融合特征历史轨迹数据车辆轨迹预测方法图像时序

针对仿真数据的编排和封装方法、装置、设备和介质

跨度信息抽取模型仿真数据实体封装方法

基于模拟训练的自然语言处理模型后门防御方法及系统

站点导航

APP 下载