一种多语言文本分类的去偏方法

AITNT
正文
推荐专利
一种多语言文本分类的去偏方法
申请号:CN202510229957
申请日期:2025-02-27
公开号:CN120144760A
公开日期:2025-06-13
类型:发明专利
摘要
本申请涉及数据分类技术领域,尤其涉及一种多语言文本分类的去偏方法,包括构建多语言文本分类去偏框架,包含文本表征模块、分类模块和去偏模块;通过深度提示调优初始化可学习提示向量,并将其添加到文本表征模块的每一层,以获取文本表示;对文本表示进行线性变换以获得预测输出,并通过交叉熵损失计算分类损失;利用特征加权对抗训练对文本特征加权,确定敏感属性鉴别损失;最终,以最小化分类损失和最大化敏感鉴别损失的加权组合为优化目标,训练去偏框架,生成无偏文本分类模型。该方法通过深度提示调优和特征加权对抗训练,有效提升了多语言文本分类的准确性和公平性,同时降低了模型训练的资源消耗,减少了偏见影响。
技术关键词
多语言 模块 文本特征加权 数据分类技术 文本分类模型 标签 样本 预训练模型 序列 令牌 框架 标记 分类器 线性 参数 分层 因子 矩阵 资源
系统为您推荐了相关专利信息
1
用于变电设备量子气体传感器提升信号强度的方法及装置
气体传感器 变电设备 估计算法 信号源 光束
2
语音数据传输方法、系统和无线通信终端
无线通信终端 中继设备 语音数据传输方法 移动终端 数据压缩
3
一种口腔系统发病风险预测方法及系统
风险预测方法 中性粒细胞计数 灰度共生矩阵 淋巴细胞 风险预测模型
4
用于涂层下金属早期缺陷的太赫兹无损检测装置及方法
无损检测装置 三维移动平台 探测器 涂层 信号采集模块
5
一种垃圾房综合管理方法及系统
综合管理方法 垃圾房 智能机器人 信息采集模块 数据模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号