一种基于对比解码的大语言模型幻觉缓解方法

AITNT
正文
推荐专利
一种基于对比解码的大语言模型幻觉缓解方法
申请号:CN202410955938
申请日期:2024-07-17
公开号:CN118964552A
公开日期:2024-11-15
类型:发明专利
摘要
本发明涉及一种基于对比解码的大语言模型幻觉缓解方法,通过从大模型最终层的预测信息中剔除潜在的幻觉成分,增强输出内容的真实性,设计多层融合机制,充分利用模型各层预测的概率分布信息。引入幻觉信息筛选模型,以简洁高效的方式,整合并分析大语言模型低层中可能蕴含的幻觉信息。通过在幻觉问答数据集上对幻觉信息筛选模型进行训练,使其能够精准捕捉并拟合数据集中普遍存在的幻觉数据特征,从而实现对幻觉信息的有效识别与过滤。在解码阶段,将模型最终层输出的概率分布与幻觉信息筛选模型输出的概率分布进行对比解码,以此差异为指导,动态调整下一个标记的生成概率分布,从而引导大语言模型在解码过程中更倾向产生真实、无幻觉的内容。
技术关键词
大语言模型 解码 数据 标签 字预测 标记 答案 索引 机制 阶段 动态 参数
系统为您推荐了相关专利信息
1
一种大数据组件的自愈运维方法、装置、设备及存储介质
集群 多模态 性能指标数据 强化学习策略 结构化日志数据
2
基于毫米波点云的虚拟现实时空数据压缩与语义增强方法
语义注意力 数据压缩 键盘输入识别 注意力机制 点云
3
跨芯片平台编译工具链方法
特征数据库 跨芯片平台 多语言 设计测试用例 词法分析器
4
一种基于EMS的储能电站管理系统
储能电站 管理系统 数据采集模块 监控模块 策略
5
信用卡欺诈行为检测方法、装置、设备和存储介质
注意力机制 全局平均池化 欺诈检测 加权特征 非线性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号