一种基于软提示调优模型防御中文文本对抗性攻击方法

正文

推荐专利

申请号：CN202411925450

申请日期：2024-12-25

公开号：CN119848253A

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种基于软提示调优模型防御中文文本对抗性攻击方法，包括1）使用五种特定于中文的文本攻击策略生成目标域数据，并引入源域和目标域来模拟原始文本和对抗文本；2）基于少量源域数据去训练初始的软提示调优模型，为目标域实例分配伪标签；3）将目标域实例划分为n个子集，通过多次迭代获取目标域实例的n个标签，同时结合图注意力模型分析句法特征；4）通过投票机制选出在多次迭代中一致的标签，作为最终训练数据进行模型训练，实现中文对抗文本的分类预测。本发明通过少量源域数据训练初始模型，揭示目标域的真实标签信息，并通过投票机制结合图注意力增强中文语法特征的软提示调优模型，实现准确分类。

技术关键词

中文文本对抗性预训练语言模型句法结构策略注意力模型标记语义节点数据汉字语法特征生成模板标签类别机制

系统为您推荐了相关专利信息

基于电磁轴承监测的主氦风机智能维护决策方法及系统

电磁轴承决策方法主动迁移学习可视化平台现场数据采集

一种D型扫地机器人的控制方法、装置及扫地机器人

D型扫地机器人运动传感器智能机器人技术周期性

台风路径的预测方法、装置、计算机设备及存储介质

多模态特征时间序列特征卫星图像数据知识图谱嵌入方法计算机可读指令

一种基于物联网控制的智能化发热地面管控方法及系统

发热地面温控管控方法网格节点

一种基于云边端协同的电动汽车充电安全预警方法

预警方法充电终端数据分析算法云端边界特征

一种基于软提示调优模型防御中文文本对抗性攻击方法

站点导航

APP 下载