一种面向中文生成大语言模型的偏见检测方法

正文

推荐专利

申请号：CN202510033099

申请日期：2025-01-09

公开号：CN120011556A

公开日期：2025-05-16

类型：发明专利

摘要

本发明提供一种面向中文生成大模型的偏见检测方法，属于自然语言处理领域，该方法包括定义偏见上下文；生成文本样本；关注度标注和分析；构建中文关注度分类器和使用关注度分类器器评估文本中的偏见。该方法通过分析由不同人口群体提示生成的文本，在中文引入了对人口群体的关注概念，并使用不同人口群体的关注度水平差异作为偏见的衡量指标。本发明还提供了一种基于预训练模型的关注分类器，可用于分析未见过的文本中的偏见。

技术关键词

面向中文大语言模型分类器文本预训练语言模型预训练模型标签自然语言定义语义样本概念指标数据

系统为您推荐了相关专利信息

手术数据管理方法、装置、设备、介质及产品

数据管理方法管理标签关键字手术内窥镜

图形用户界面智能体环境攻击评估方法及相关装置

图形用户界面样本语义模块背景壁纸

一种任务处理方法、装置、电子设备及存储介质

意图语音规划车辆智能控制计算机

图像处理方法、图像生成模型的训练方法及装置

可变形卷积网络图像生成模型多尺度噪声数据图像处理方法

一种结合领域知识的工业过程小样本数据生成方法及装置

数据生成模型样本数据生成方法生成样本数据数据生成装置计算机可读取存储介质

一种面向中文生成大语言模型的偏见检测方法

站点导航

APP 下载