语义连贯的文本分类硬标签黑盒模型对抗样本生成方法

正文

推荐专利

申请号：CN202510170390

申请日期：2025-02-17

公开号：CN120123763A

公开日期：2025-06-10

类型：发明专利

摘要

本发明涉及语义连贯的文本分类硬标签黑盒模型对抗样本生成方法，属于人工智能安全领域。本发明首先对原始样本进行多轮随机同义词替换直至黑盒模型分类错误；然后在替换词词向量的邻域内采用原型估计方法估计黑盒模型的决策边界，计算替换词的同义词到决策边界的欧氏距离，并为每个替换词选择接近边界的多个同义词分别进行替换，选出使得黑盒模型分类错误的样本构建候选对抗样本集；最后利用USE模型计算候选对抗样本与原始样本的语义相似度，选择最相似对抗样本作为最终对抗样本。本发明针对现有方法中词替换改变原始语义致使生成的对抗样本语义连贯性差的问题，通过分析原始样本的语义信息指导同义词选择，提升对抗样本与原始样本的语义相似度。

技术关键词

黑盒模型同义词样本生成方法语义估计方法决策对抗性原型文本标签贪婪算法编码器邻域

系统为您推荐了相关专利信息

一种数据驱动的机电系统参数与状态同时估计方法

扩张状态观测器参数估计误差估计方法系统参数估计机电系统控制

一种基于推理分割的土地覆盖分类方法

土地覆盖分类方法多尺度特征提取文本图像智能分类技术

一种曲库检索方法、系统、设备及介质

检索方法标签语义动态可读存储介质

一种基于大语言模型的配电系统规划方法及系统

配电系统规划文本段落大语言模型图片模型更新

一种基于视觉显著性预测的公园图像焦点物体提取方法

语义分割模型视觉物体图像焦点

语义连贯的文本分类硬标签黑盒模型对抗样本生成方法

站点导航

APP 下载