基于SHAP values的文本后门防御方法及系统

正文

推荐专利

申请号：CN202510184818

申请日期：2025-02-19

公开号：CN120012762A

公开日期：2025-05-16

类型：发明专利

摘要

本发明提供一种基于SHAP values的文本后门防御方法及系统，该方法包括：使用SHAP可解释器获取待处理句子中各特征词的SHAP values值；将所述待处理句子中SHAP values值最大的第一预设数量的特征词作为怀疑词；将所述怀疑词的SHAP values值与预设阈值进行比较，根据比较结果对所述怀疑词进行删除或词替换，得到新句子。本发明使用SHAP可解释器能准确检测出样本中的后门触发器，结合对怀疑词的删除和词替换操作，在高效地实现文本后门防御的同时，保留了原始样本的语义完整。

技术关键词

后门文本非暂态计算机可读存储介质预测类别样本 BERT模型防御系统处理器语义分析模块存储器电子设备词语字符程序

系统为您推荐了相关专利信息

基于多模态数据融合的眼科远程智能会诊系统及方法

多模态数据融合会诊系统图谱多模态特征融合特征

铁路施工工具的核查方法、装置、电子设备及存储介质

铁路施工工具核查方法检测器图像训练样本集

一种大模型增强的半开放知识抽取方法和系统

开放知识抽取三元组实体种子关注点

一种机载复杂电子硬件需求和代码的一致性检测方法

一致性检测文本语句深度学习模型概念

基于大语言模型的招标文件检测方法及系统

大语言模型企业知识图谱文件检测方法检测点文本

基于SHAP values的文本后门防御方法及系统

站点导航

APP 下载