摘要
本发明公开了一种基于反义词替换的文本对抗攻击方法,包括1)通过LAC、HanLP、LTP分词和词性标注工具对原始文本进行分词,并标注出其中的形容词;2)利用OpenHowNet对未标注的文本进一步筛选,生成与正向或负向形容词相关的词汇库,并对相似度大于阈值的词语进行标注;3)采用基于贪心算法和词语重要性排序的搜索算法,根据重要性分数对词语进行排序,确定文本中各个词的扰动顺序;4)基于筛选和人工标注结果,构建出一个完整的反义词库,并对标注出的形容词进行扰动,生成高相似度且可读的对抗文本。本发明基于反义词替换策略,提出通过特殊结构进行文本扰动,使生成的对抗文本既保持原文本的语义相似度,又能够有效干扰情感分类模型的判断。
技术关键词
文本
词语
贪心算法
标注工具
搜索算法
情感分类模型
中文分词
语义
标记
序列
策略
标签
对象
系统为您推荐了相关专利信息
互补集合经验模态分解
序列
锂电池
剩余使用寿命
周期
业务场景预测
项目管理方法
场景知识图谱
语义规则
实体关系数据