面向多语言文本分类的上下文学习去偏框架、产品及设备

正文

推荐专利

申请号：CN202510537022

申请日期：2025-04-25

公开号：CN120448544A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种面向多语言文本分类的上下文学习去偏框架、产品及设备，属于人工智能技术领域。该框架包括：样本选择模块，被配置为能够计算基于Sentence‑BERT的语义相似度，并根据计算的语义相似度从预设的样本集中选择出和测试实例最相似的若干训练样本；样本过滤模块，被配置为能够通过上下文差异度量从样本选择模块选出的训练样本中筛选出在各敏感属性下表现差异显著的样本；模板填充与预测模块，被配置为能够将样本过滤模块筛选出的样本填入预定义模板中，结合测试实例输入到大语言模型中生成预测结果。本发明可以提高大型语言模型在处理多语言文本时的公平性和准确性。

技术关键词

多语言样本过滤模块文本语义框架模板人工智能技术计算机程序产品处理器计算机设备度量存储器编码

系统为您推荐了相关专利信息

EBV感染表皮细胞和B细胞模型的构建

细胞系活细胞制剂转录开关转录激活因子质粒

信息查询方法以及模型训练方法

实体识别模型信息查询方法文本字段计算机可执行指令

一种面向大语言模型的高效数据检索方法及系统

文本查询场景意图语义向量数据检索方法

一种基于通信中间件的多协议数据包解析重组方法及装置

有效载荷数据中间件协议转换模块标识符关键字

隐患排查治理系统及排查治理方法

检查单元企业知识库子模块隐患排查治理系统语义特征

面向多语言文本分类的上下文学习去偏框架、产品及设备

站点导航

APP 下载