一种基于上下文保持的文本对抗样本语义提升方法

AITNT
正文
推荐专利
一种基于上下文保持的文本对抗样本语义提升方法
申请号:CN202510236649
申请日期:2025-02-28
公开号:CN120373270A
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于上下文保持的文本对抗样本语义提升方法。所述方法包括如下步骤:在未标注的公开数据集上构建关键词空间与词性扰动空间;确定语义扰动位置,生成知识标签;对纠错检查后的知识标签进行合理性排序;将排序后的知识标签与公开数据集通过特殊令牌组合得到标注数据;将每个标注数据将通过预定义的映射函数进行分词,得到令牌序列,对令牌序列进行文本的编码填充,得到填充后的令牌序列;利用填充后的令牌序列,完成多任务语义自适应训练,使用语义训练后的掩码语言模型进行基于掩码语言模型的文本对抗样本生成。本发明在不影响生成文本质量的情况下,能够有效提高基于掩码语言模型生成的文本对抗样本的语义一致性和攻击效率。
技术关键词
令牌 上下文语义信息 文本 序列 多任务 样本 语义关键词 语义标签 数据 纠错 关键词提取技术 大语言模型 同义词 参数 编码 生成知识 注意力
系统为您推荐了相关专利信息
1
目标对象属性信息预测方法、电子设备及计算机存储介质
对象属性信息 多模态 文本特征向量 计算机存储介质 图像
2
压铸缺陷检测方法、装置及设备
视觉图像信息 压铸件 缺陷检测方法 边缘检测 特征点
3
一种视频帧剪辑图像分割处理方法
像素点 视频帧 图像分割 描述符 局部二值模式特征
4
基于时序回归及增量学习模型的学生数学能力评估方法
数学 能力评估方法 学生 答题 滑动窗口
5
一种基于多模态商单视频的内容提取及投放方法
多模态特征 视频 坐标 策略 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号