面向多语言文本分类的上下文学习去偏框架、产品及设备

AITNT
正文
推荐专利
面向多语言文本分类的上下文学习去偏框架、产品及设备
申请号:CN202510537022
申请日期:2025-04-25
公开号:CN120448544A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开了一种面向多语言文本分类的上下文学习去偏框架、产品及设备,属于人工智能技术领域。该框架包括:样本选择模块,被配置为能够计算基于Sentence‑BERT的语义相似度,并根据计算的语义相似度从预设的样本集中选择出和测试实例最相似的若干训练样本;样本过滤模块,被配置为能够通过上下文差异度量从样本选择模块选出的训练样本中筛选出在各敏感属性下表现差异显著的样本;模板填充与预测模块,被配置为能够将样本过滤模块筛选出的样本填入预定义模板中,结合测试实例输入到大语言模型中生成预测结果。本发明可以提高大型语言模型在处理多语言文本时的公平性和准确性。
技术关键词
多语言 样本 过滤模块 文本 语义 框架 模板 人工智能技术 计算机程序产品 处理器 计算机设备 度量 存储器 编码
系统为您推荐了相关专利信息
1
EBV感染表皮细胞和B细胞模型的构建
细胞系 活细胞制剂 转录开关 转录激活因子 质粒
2
信息查询方法以及模型训练方法
实体识别模型 信息查询方法 文本 字段 计算机可执行指令
3
一种面向大语言模型的高效数据检索方法及系统
文本 查询场景 意图 语义向量 数据检索方法
4
一种基于通信中间件的多协议数据包解析重组方法及装置
有效载荷数据 中间件 协议转换模块 标识符 关键字
5
隐患排查治理系统及排查治理方法
检查单元 企业知识库 子模块 隐患排查治理系统 语义特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号