摘要
本发明提供一种大语言模型幻觉检测方法,涉及人工智能技术领域,所述方法包括:获取待检测参考回答对应的原始输入问题,对原始输入问题进行改写,获得改写问题;通过待检测大语言模型对改写问题进行回答采样,获得多个随机性生成回答;基于原始输入问题和随机性生成回答生成多个语义向量;对嵌入矩阵进行聚类处理,获得聚类结果;根据聚类结果计算语义熵;根据语义熵评估待检测参考回答为幻觉的可能性,输出待检测参考回答是否为幻觉的二元判断结果。与现有幻觉检测方法相比,本发明聚类效果更优,能够避免因表述差异导致的过度分割,且作为一种黑盒测试框架,无需访问大语言模型内部参数,具有良好的泛用性。
技术关键词
大语言模型
语义向量
层次聚类算法
句法结构
矩阵
人工智能技术
序列
参数
框架
系统为您推荐了相关专利信息
损伤检测方法
钢桥面板
超声导波
遗传算法
超声波接收探头
动态监测系统
柔性微电极阵列
时序误差
监测策略
历史监测数据
状态转换系统
反馈控制系统
稳定方法
信号输出系统
矩阵
运动康复系统
运动康复方法
刺激参数优化
多模态磁共振
运动功能评估
智能控制芯片
双通道神经网络
动态分配方法
全局资源分配
协同调度策略