基于SHAP values的文本后门防御方法及系统

AITNT
正文
推荐专利
基于SHAP values的文本后门防御方法及系统
申请号:CN202510184818
申请日期:2025-02-19
公开号:CN120012762A
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供一种基于SHAP values的文本后门防御方法及系统,该方法包括:使用SHAP可解释器获取待处理句子中各特征词的SHAP values值;将所述待处理句子中SHAP values值最大的第一预设数量的特征词作为怀疑词;将所述怀疑词的SHAP values值与预设阈值进行比较,根据比较结果对所述怀疑词进行删除或词替换,得到新句子。本发明使用SHAP可解释器能准确检测出样本中的后门触发器,结合对怀疑词的删除和词替换操作,在高效地实现文本后门防御的同时,保留了原始样本的语义完整。
技术关键词
后门 文本 非暂态计算机可读存储介质 预测类别 样本 BERT模型 防御系统 处理器 语义 分析模块 存储器 电子设备 词语 字符 程序
系统为您推荐了相关专利信息
1
基于多模态数据融合的眼科远程智能会诊系统及方法
多模态数据融合 会诊系统 图谱 多模态特征 融合特征
2
铁路施工工具的核查方法、装置、电子设备及存储介质
铁路施工工具 核查方法 检测器 图像 训练样本集
3
一种大模型增强的半开放知识抽取方法和系统
开放知识抽取 三元组 实体 种子 关注点
4
一种机载复杂电子硬件需求和代码的一致性检测方法
一致性检测 文本 语句 深度学习模型 概念
5
基于大语言模型的招标文件检测方法及系统
大语言模型 企业知识图谱 文件检测方法 检测点 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号