摘要
本申请提出了基于语义嵌入和结构熵检测的幻觉检测方法及其装置;其方法包括:针对输入问题,利用训练好的语言模型生成多个可能的答案集合;使用预训练的句子嵌入模型将每个答案转换为向量,计算它们之间的余弦相似度,从而构建相似性图;通过编码树对相似性图进行表示,计算每个节点的结构熵,以识别语义不确定性较高的节点;采用滑动平均法动态调整阈值,确保高熵输出得以及时标记为幻觉;将被标记为幻觉的答案剔除,确保输出的答案准确性和信息一致性。本发明有效提升了模型在复杂问题上的表现,减少了误导性信息的生成。初步实验表明,该方法在多个数据集上显著降低了幻觉输出的比例,增强了生成答案的语义一致性和准确性。
技术关键词
表达式
语义
标记
节点
向量提取方法
生成答案
数据
BERT模型
顶点
参数
资料
样本
编码
动态
系统为您推荐了相关专利信息
全基因组芯片
马尾松
全基因组关联分析
种质资源鉴定
标记
干扰识别模型
干扰识别方法
资源分配信息
波束
表达式
图像识别方法
图像编码器
融合图像特征
注意力
文本编码器
有损压缩方法
轮廓提取方法
语义模板
关键点
密度