摘要
本发明公开了一种基于软提示调优模型防御中文文本对抗性攻击方法,包括1)使用五种特定于中文的文本攻击策略生成目标域数据,并引入源域和目标域来模拟原始文本和对抗文本;2)基于少量源域数据去训练初始的软提示调优模型,为目标域实例分配伪标签;3)将目标域实例划分为n个子集,通过多次迭代获取目标域实例的n个标签,同时结合图注意力模型分析句法特征;4)通过投票机制选出在多次迭代中一致的标签,作为最终训练数据进行模型训练,实现中文对抗文本的分类预测。本发明通过少量源域数据训练初始模型,揭示目标域的真实标签信息,并通过投票机制结合图注意力增强中文语法特征的软提示调优模型,实现准确分类。
技术关键词
中文文本
对抗性
预训练语言模型
句法结构
策略
注意力模型
标记
语义
节点
数据
汉字
语法特征
生成模板
标签类别
机制
系统为您推荐了相关专利信息
电磁轴承
决策方法
主动迁移学习
可视化平台
现场数据采集
D型扫地机器人
运动
传感器
智能机器人技术
周期性
多模态特征
时间序列特征
卫星图像数据
知识图谱嵌入方法
计算机可读指令