面向零知识场景的大模型输出内容幻觉检测方法及系统

AITNT
正文
推荐专利
面向零知识场景的大模型输出内容幻觉检测方法及系统
申请号:CN202510773381
申请日期:2025-06-11
公开号:CN120723907A
公开日期:2025-09-30
类型:发明专利
摘要
本发明提出一种面向零知识场景的大模型输出内容幻觉检测方法及系统,属于大模型安全应用领域,包括:S1:从大型语言模型LLMs中提取内部状态特征和输出概率特征,其中内部状态特征包括:全上下文平均嵌入ACE和末端词嵌入FTE;输出概率特征包括:词概率TP熵值En;S2:将特征ACE、FTE、TP和En输入分类检测模块进行训练;得到训练好的分类检测模块;S3:当LLMs接受输入提示并开始生成文本时,实时提取特征ACE、FTE、TP和En,并将其输入训练好的分类检测模块,判断该文本的内容是否为幻觉。本发明方法无需外部知识源、结合内部和外部特征的高效、准确地进行幻觉检测。
技术关键词
文本 Sigmoid函数 场景 处理器 电子设备 特征提取模块 搜索算法 序列 可读存储介质 样本 标记 代表 程序 指令 日志 存储器 计算机 数据
系统为您推荐了相关专利信息
1
基于文本片段表征学习的地名识别方法、装置及设备
文本 实体 地名识别方法 语义 编码器
2
一种直播交互方法、装置、电子设备和存储介质
直播交互方法 界面 直播间数据 标识 游戏页面
3
一种漫画图像生成方法、装置、设备及存储介质
图像生成方法 漫画 文本 适配器 关键点
4
一种模型评测方法、系统、设备、介质、产品
机器学习模型 基准 模型评测方法 生成榜单 导入工具
5
文本修正的方法、装置及电子设备
字符 编码向量 文本 非易失性存储介质 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号