摘要
本发明公开了一种基于隐层激活的偏见幻觉检测方法。该方法包括:根据语言模型回答的行为特征评估信念状态,获得信念状态评估结果,所述信念状态反映该语言模型对回答的不确定程度;基于所述信念状态评估结果构建训练集,并训练信念状态分类器,所述训练集反映所述语言模型的信念状态与隐层激活之间的对应关系;实时获取目标语言模型生成过程中的隐层激活,并根据该隐层激活,利用经训练的信念状态分类器判断信念状态;对于检测出的幻觉,结合所述目标语言模型的输出正确性与所述信念状态分类器判断出的信念状态,判断幻觉类别。本发明基于模型隐层激活进行信念状态判定,提高了偏见幻觉检测的准确率。
技术关键词
分类器
答案
构建训练集
sigmoid函数
前馈神经网络
处理器
计算机设备
可读存储介质
格式
存储器
标签
关系
度量
样本
频率
系统为您推荐了相关专利信息
面向电力行业
筛选方法
通道
可拆卸式电极
FastICA算法
切削液
深度神经网络模型
工况参数
滑模控制算法
李雅普诺夫函数
特征提取模块
识别方法
训练样本集
识别系统
前馈神经网络
双流神经网络
长短期记忆网络
分类方法
分类器
多普勒