一种多语言文本分类的去偏方法

正文

推荐专利

一种多语言文本分类的去偏方法

申请号：CN202510229957

申请日期：2025-02-27

公开号：CN120144760A

公开日期：2025-06-13

类型：发明专利

摘要

本申请涉及数据分类技术领域，尤其涉及一种多语言文本分类的去偏方法，包括构建多语言文本分类去偏框架，包含文本表征模块、分类模块和去偏模块；通过深度提示调优初始化可学习提示向量，并将其添加到文本表征模块的每一层，以获取文本表示；对文本表示进行线性变换以获得预测输出，并通过交叉熵损失计算分类损失；利用特征加权对抗训练对文本特征加权，确定敏感属性鉴别损失；最终，以最小化分类损失和最大化敏感鉴别损失的加权组合为优化目标，训练去偏框架，生成无偏文本分类模型。该方法通过深度提示调优和特征加权对抗训练，有效提升了多语言文本分类的准确性和公平性，同时降低了模型训练的资源消耗，减少了偏见影响。

技术关键词

多语言模块文本特征加权数据分类技术文本分类模型标签样本预训练模型序列令牌框架标记分类器线性参数分层因子矩阵资源

系统为您推荐了相关专利信息

用于变电设备量子气体传感器提升信号强度的方法及装置

气体传感器变电设备估计算法信号源光束

语音数据传输方法、系统和无线通信终端

无线通信终端中继设备语音数据传输方法移动终端数据压缩

一种口腔系统发病风险预测方法及系统

风险预测方法中性粒细胞计数灰度共生矩阵淋巴细胞风险预测模型

用于涂层下金属早期缺陷的太赫兹无损检测装置及方法

无损检测装置三维移动平台探测器涂层信号采集模块

一种垃圾房综合管理方法及系统

综合管理方法垃圾房智能机器人信息采集模块数据模块

一种多语言文本分类的去偏方法

站点导航

APP 下载