一种基于注意力分数的文本对抗攻击方法

AITNT
正文
推荐专利
一种基于注意力分数的文本对抗攻击方法
申请号:CN202510947354
申请日期:2025-07-09
公开号:CN120764623A
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及人工智能安全技术领域,具体涉及一种基于注意力分数的文本对抗攻击方法,包括如下步骤,获取原始输入文本并对原始输入文本预处理,获得可处理的原始输入文本;利用HAN模型计算获得可处理的原始输入文本对应单词的注意力权重分数,获得注意力得分序列;筛选注意力得分序列的候选替换位置,获得候选扰动位置集合;基于RoBERTa模型生成候选替换词并筛选,获得上下文适应性强的替换词集合;搜索最优替换组合并生对抗样本;对对抗样本进行质量控制,输出最终攻击样本Xadv。
技术关键词
注意力 文本 样本 序列 单层感知机 语义 决策 格式 矩阵 指标 标记 代表 网络 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号