一种基于上下文保持的文本对抗样本语义提升方法

正文

推荐专利

申请号：CN202510236649

申请日期：2025-02-28

公开号：CN120373270A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于上下文保持的文本对抗样本语义提升方法。所述方法包括如下步骤：在未标注的公开数据集上构建关键词空间与词性扰动空间；确定语义扰动位置，生成知识标签；对纠错检查后的知识标签进行合理性排序；将排序后的知识标签与公开数据集通过特殊令牌组合得到标注数据；将每个标注数据将通过预定义的映射函数进行分词，得到令牌序列，对令牌序列进行文本的编码填充，得到填充后的令牌序列；利用填充后的令牌序列，完成多任务语义自适应训练，使用语义训练后的掩码语言模型进行基于掩码语言模型的文本对抗样本生成。本发明在不影响生成文本质量的情况下，能够有效提高基于掩码语言模型生成的文本对抗样本的语义一致性和攻击效率。

技术关键词

令牌上下文语义信息文本序列多任务样本语义关键词语义标签数据纠错关键词提取技术大语言模型同义词参数编码生成知识注意力

系统为您推荐了相关专利信息

目标对象属性信息预测方法、电子设备及计算机存储介质

对象属性信息多模态文本特征向量计算机存储介质图像

压铸缺陷检测方法、装置及设备

视觉图像信息压铸件缺陷检测方法边缘检测特征点

一种视频帧剪辑图像分割处理方法

像素点视频帧图像分割描述符局部二值模式特征

基于时序回归及增量学习模型的学生数学能力评估方法

数学能力评估方法学生答题滑动窗口

一种基于多模态商单视频的内容提取及投放方法

多模态特征视频坐标策略标识

一种基于上下文保持的文本对抗样本语义提升方法

站点导航

APP 下载