摘要
本发明提供一种面向中文生成大模型的偏见检测方法,属于自然语言处理领域,该方法包括定义偏见上下文;生成文本样本;关注度标注和分析;构建中文关注度分类器和使用关注度分类器器评估文本中的偏见。该方法通过分析由不同人口群体提示生成的文本,在中文引入了对人口群体的关注概念,并使用不同人口群体的关注度水平差异作为偏见的衡量指标。本发明还提供了一种基于预训练模型的关注分类器,可用于分析未见过的文本中的偏见。
技术关键词
面向中文
大语言模型
分类器
文本
预训练语言模型
预训练模型
标签
自然语言
定义
语义
样本
概念
指标
数据
系统为您推荐了相关专利信息
可变形卷积网络
图像生成模型
多尺度
噪声数据
图像处理方法
数据生成模型
样本数据生成方法
生成样本数据
数据生成装置
计算机可读取存储介质