一种基于对比解码的大语言模型幻觉缓解方法

正文

推荐专利

申请号：CN202410955938

申请日期：2024-07-17

公开号：CN118964552A

公开日期：2024-11-15

类型：发明专利

摘要

本发明涉及一种基于对比解码的大语言模型幻觉缓解方法，通过从大模型最终层的预测信息中剔除潜在的幻觉成分，增强输出内容的真实性，设计多层融合机制，充分利用模型各层预测的概率分布信息。引入幻觉信息筛选模型，以简洁高效的方式，整合并分析大语言模型低层中可能蕴含的幻觉信息。通过在幻觉问答数据集上对幻觉信息筛选模型进行训练，使其能够精准捕捉并拟合数据集中普遍存在的幻觉数据特征，从而实现对幻觉信息的有效识别与过滤。在解码阶段，将模型最终层输出的概率分布与幻觉信息筛选模型输出的概率分布进行对比解码，以此差异为指导，动态调整下一个标记的生成概率分布，从而引导大语言模型在解码过程中更倾向产生真实、无幻觉的内容。

技术关键词

大语言模型解码数据标签字预测标记答案索引机制阶段动态参数

系统为您推荐了相关专利信息

一种大数据组件的自愈运维方法、装置、设备及存储介质

集群多模态性能指标数据强化学习策略结构化日志数据

基于毫米波点云的虚拟现实时空数据压缩与语义增强方法

语义注意力数据压缩键盘输入识别注意力机制点云

跨芯片平台编译工具链方法

特征数据库跨芯片平台多语言设计测试用例词法分析器

一种基于EMS的储能电站管理系统

储能电站管理系统数据采集模块监控模块策略

信用卡欺诈行为检测方法、装置、设备和存储介质

注意力机制全局平均池化欺诈检测加权特征非线性

一种基于对比解码的大语言模型幻觉缓解方法

站点导航

APP 下载