摘要
本申请涉及数据分类技术领域,尤其涉及一种多语言文本分类的去偏方法,包括构建多语言文本分类去偏框架,包含文本表征模块、分类模块和去偏模块;通过深度提示调优初始化可学习提示向量,并将其添加到文本表征模块的每一层,以获取文本表示;对文本表示进行线性变换以获得预测输出,并通过交叉熵损失计算分类损失;利用特征加权对抗训练对文本特征加权,确定敏感属性鉴别损失;最终,以最小化分类损失和最大化敏感鉴别损失的加权组合为优化目标,训练去偏框架,生成无偏文本分类模型。该方法通过深度提示调优和特征加权对抗训练,有效提升了多语言文本分类的准确性和公平性,同时降低了模型训练的资源消耗,减少了偏见影响。
技术关键词
多语言
模块
文本特征加权
数据分类技术
文本分类模型
标签
样本
预训练模型
序列
令牌
框架
标记
分类器
线性
参数
分层
因子
矩阵
资源
系统为您推荐了相关专利信息
无线通信终端
中继设备
语音数据传输方法
移动终端
数据压缩
风险预测方法
中性粒细胞计数
灰度共生矩阵
淋巴细胞
风险预测模型
无损检测装置
三维移动平台
探测器
涂层
信号采集模块
综合管理方法
垃圾房
智能机器人
信息采集模块
数据模块