面向零知识场景的大模型输出内容幻觉检测方法及系统

正文

推荐专利

申请号：CN202510773381

申请日期：2025-06-11

公开号：CN120723907A

公开日期：2025-09-30

类型：发明专利

摘要

本发明提出一种面向零知识场景的大模型输出内容幻觉检测方法及系统，属于大模型安全应用领域，包括：S1：从大型语言模型LLMs中提取内部状态特征和输出概率特征，其中内部状态特征包括：全上下文平均嵌入ACE和末端词嵌入FTE；输出概率特征包括：词概率TP熵值En；S2：将特征ACE、FTE、TP和En输入分类检测模块进行训练；得到训练好的分类检测模块；S3：当LLMs接受输入提示并开始生成文本时，实时提取特征ACE、FTE、TP和En，并将其输入训练好的分类检测模块，判断该文本的内容是否为幻觉。本发明方法无需外部知识源、结合内部和外部特征的高效、准确地进行幻觉检测。

技术关键词

文本 Sigmoid函数场景处理器电子设备特征提取模块搜索算法序列可读存储介质样本标记代表程序指令日志存储器计算机数据

系统为您推荐了相关专利信息

基于文本片段表征学习的地名识别方法、装置及设备

文本实体地名识别方法语义编码器

一种直播交互方法、装置、电子设备和存储介质

直播交互方法界面直播间数据标识游戏页面

一种漫画图像生成方法、装置、设备及存储介质

图像生成方法漫画文本适配器关键点

一种模型评测方法、系统、设备、介质、产品

机器学习模型基准模型评测方法生成榜单导入工具

文本修正的方法、装置及电子设备

字符编码向量文本非易失性存储介质音频

面向零知识场景的大模型输出内容幻觉检测方法及系统

站点导航

APP 下载