一种基于隐层激活的偏见幻觉检测方法

AITNT
正文
推荐专利
一种基于隐层激活的偏见幻觉检测方法
申请号:CN202411724634
申请日期:2024-11-28
公开号:CN119829962B
公开日期:2025-10-24
类型:发明专利
摘要
本发明公开了一种基于隐层激活的偏见幻觉检测方法。该方法包括:根据语言模型回答的行为特征评估信念状态,获得信念状态评估结果,所述信念状态反映该语言模型对回答的不确定程度;基于所述信念状态评估结果构建训练集,并训练信念状态分类器,所述训练集反映所述语言模型的信念状态与隐层激活之间的对应关系;实时获取目标语言模型生成过程中的隐层激活,并根据该隐层激活,利用经训练的信念状态分类器判断信念状态;对于检测出的幻觉,结合所述目标语言模型的输出正确性与所述信念状态分类器判断出的信念状态,判断幻觉类别。本发明基于模型隐层激活进行信念状态判定,提高了偏见幻觉检测的准确率。
技术关键词
分类器 答案 构建训练集 sigmoid函数 前馈神经网络 处理器 计算机设备 可读存储介质 格式 存储器 标签 关系 度量 样本 频率
系统为您推荐了相关专利信息
1
一种面向电力行业脑电帽的关键通道筛选方法及系统
面向电力行业 筛选方法 通道 可拆卸式电极 FastICA算法
2
基于消息队列的客服对象分配方法和装置、设备及介质
客服 实体 对象分配方法 会话 语义特征
3
一种基于深度学习的自适应切削液配方优化方法及系统
切削液 深度神经网络模型 工况参数 滑模控制算法 李雅普诺夫函数
4
一种治疗响应者的识别方法和系统
特征提取模块 识别方法 训练样本集 识别系统 前馈神经网络
5
基于双流神经网络的行为检测与分类方法
双流神经网络 长短期记忆网络 分类方法 分类器 多普勒
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号