一种基于隐层激活的偏见幻觉检测方法

正文

推荐专利

一种基于隐层激活的偏见幻觉检测方法

申请号：CN202411724634

申请日期：2024-11-28

公开号：CN119829962B

公开日期：2025-10-24

类型：发明专利

摘要

本发明公开了一种基于隐层激活的偏见幻觉检测方法。该方法包括：根据语言模型回答的行为特征评估信念状态，获得信念状态评估结果，所述信念状态反映该语言模型对回答的不确定程度；基于所述信念状态评估结果构建训练集，并训练信念状态分类器，所述训练集反映所述语言模型的信念状态与隐层激活之间的对应关系；实时获取目标语言模型生成过程中的隐层激活，并根据该隐层激活，利用经训练的信念状态分类器判断信念状态；对于检测出的幻觉，结合所述目标语言模型的输出正确性与所述信念状态分类器判断出的信念状态，判断幻觉类别。本发明基于模型隐层激活进行信念状态判定，提高了偏见幻觉检测的准确率。

技术关键词

分类器答案构建训练集 sigmoid函数前馈神经网络处理器计算机设备可读存储介质格式存储器标签关系度量样本频率

系统为您推荐了相关专利信息

一种面向电力行业脑电帽的关键通道筛选方法及系统

面向电力行业筛选方法通道可拆卸式电极 FastICA算法

基于消息队列的客服对象分配方法和装置、设备及介质

客服实体对象分配方法会话语义特征

一种基于深度学习的自适应切削液配方优化方法及系统

切削液深度神经网络模型工况参数滑模控制算法李雅普诺夫函数

一种治疗响应者的识别方法和系统

特征提取模块识别方法训练样本集识别系统前馈神经网络

基于双流神经网络的行为检测与分类方法

双流神经网络长短期记忆网络分类方法分类器多普勒

一种基于隐层激活的偏见幻觉检测方法

站点导航

APP 下载