摘要
本发明涉及一种基于对比解码的大语言模型幻觉缓解方法,通过从大模型最终层的预测信息中剔除潜在的幻觉成分,增强输出内容的真实性,设计多层融合机制,充分利用模型各层预测的概率分布信息。引入幻觉信息筛选模型,以简洁高效的方式,整合并分析大语言模型低层中可能蕴含的幻觉信息。通过在幻觉问答数据集上对幻觉信息筛选模型进行训练,使其能够精准捕捉并拟合数据集中普遍存在的幻觉数据特征,从而实现对幻觉信息的有效识别与过滤。在解码阶段,将模型最终层输出的概率分布与幻觉信息筛选模型输出的概率分布进行对比解码,以此差异为指导,动态调整下一个标记的生成概率分布,从而引导大语言模型在解码过程中更倾向产生真实、无幻觉的内容。
技术关键词
大语言模型
解码
数据
标签
字预测
标记
答案
索引
机制
阶段
动态
参数
系统为您推荐了相关专利信息
集群
多模态
性能指标数据
强化学习策略
结构化日志数据
语义注意力
数据压缩
键盘输入识别
注意力机制
点云
特征数据库
跨芯片平台
多语言
设计测试用例
词法分析器
注意力机制
全局平均池化
欺诈检测
加权特征
非线性