用于自然语言处理模型后门攻击防御的处理方法和装置

正文

推荐专利

申请号：CN202510913646

申请日期：2025-07-03

公开号：CN120409615B

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及计算机技术应用领域，特别是涉及一种用于自然语言处理模型后门攻击防御的处理方法和装置，方法包括：利用数据增强方式生成文本样本的不同视图对自然语言处理模型进行第一阶段训练以及利用干净文本数据对模型进行第二阶段训练。本发明能够让模型学习文本样重要的特征，忽略小扰动对样本内容的干扰，破坏攻击者构建的触发器与目标类别之间的强联系，能够降低触发器对模型决策的干扰和增强模型鲁棒性，确保有效防御后门攻击的同时，保持模型分类任务的性能。

技术关键词

卷积特征提取数据处理模型自然语言标记特征加权特征输出特征后门文本编码器数据获取模块特征值样本鲁棒性注意力参数决策

系统为您推荐了相关专利信息

一种企业销售数据的快速提取方法、设备及介质

数据分析算法企业图表关键词文本

一种智能客服系统的优化方法、系统、设备及介质

智能客服系统分词情感分析模型分类模型识别自然语言

基于OTT行业自然语言分析的内容推荐方法及装置

视频自然语言分析内容推荐方法文本分析标签

一种星辰大模型用于智算中心巡检分析的方法、介质和设备

语义数据库业务运行状态文本巡检数据生成自然语言

一种基于智能胸牌的客户诉求智能甄别及回答方法及系统

智能胸牌客户声学特征生成智能回答系统

用于自然语言处理模型后门攻击防御的处理方法和装置

站点导航

APP 下载