一种针对数据投毒的样本过滤后门防御方法、装置及设备

正文

推荐专利

申请号：CN202510333261

申请日期：2025-03-20

公开号：CN120256984A

公开日期：2025-07-04

类型：发明专利

摘要

本发明提供了一种针对数据投毒的样本过滤后门防御方法、装置及设备，应用于自然语言处理领域，方法包括：基于RoBERTa模型对文本数据集进行表征学习，提取并存储数据样本高维特征；基于t‑SNE算法降维，将高维特征降维至低维特征；采用OPTICS算法对降维后的特征进行聚类，识别样本的密度簇；最后通过聚类结果过滤低密度区域的中毒样本，保留可信的正常数据。通过本发明的技术方案，能够在训练阶段有效过滤中毒样本同时保留正常样本，确保模型在训练过程中不受中毒样本的干扰，保持较高的实用性和准确性。

技术关键词

样本文本聚类后门队列数据算法低密度防御设备核心梯度下降法特征提取模块处理器过滤模块语义特征存储器自然语言邻域代表

系统为您推荐了相关专利信息

适用于生物制药生产过程的数据计算方法及系统

数据计算方法节点深度优先搜索算法标识符模版

基于深度学习技术的供应链数据分析系统

数据分析系统深度学习技术数字孪生决策控制执行模块

文档识别方法及智能交互方法和相关装置、设备、介质

序列文档识别方法元素智能交互方法语义分析模型

一种基于5GMRO测量的异网站址识别方法

时间提前量分类器模型小区识别方法标识

基于多模态的边缘自适应控制系统

子模块多模态控制策略控制系统资源分配模块

一种针对数据投毒的样本过滤后门防御方法、装置及设备

站点导航

APP 下载