摘要
本发明公开了一种面向多语言文本分类的上下文学习去偏框架、产品及设备,属于人工智能技术领域。该框架包括:样本选择模块,被配置为能够计算基于Sentence‑BERT的语义相似度,并根据计算的语义相似度从预设的样本集中选择出和测试实例最相似的若干训练样本;样本过滤模块,被配置为能够通过上下文差异度量从样本选择模块选出的训练样本中筛选出在各敏感属性下表现差异显著的样本;模板填充与预测模块,被配置为能够将样本过滤模块筛选出的样本填入预定义模板中,结合测试实例输入到大语言模型中生成预测结果。本发明可以提高大型语言模型在处理多语言文本时的公平性和准确性。
技术关键词
多语言
样本
过滤模块
文本
语义
框架
模板
人工智能技术
计算机程序产品
处理器
计算机设备
度量
存储器
编码
系统为您推荐了相关专利信息
实体识别模型
信息查询方法
文本
字段
计算机可执行指令
有效载荷数据
中间件
协议转换模块
标识符
关键字
检查单元
企业知识库
子模块
隐患排查治理系统
语义特征