摘要
本发明提供一种大语言模型的动态随机性解码方法,属于人工智能技术领域,尤其适用大语言模型的开放式文本生成任务。该方法通过建模生成过程中的知识感知强度,量化模型对事实性知识的依赖程度;并基于该强度构建焦点转换机制,将其映射为动态调节解码温度的信号;基于动态温度参数对目标概率分布进行解码,生成查询文本对应的答案。本发明结合传统随机采样方法(如温度采样、top‑k采样、nucleus采样),在每个生成步骤中动态调整输出概率分布,实现生成内容在事实性与多样性之间的自适应平衡,在无需引入外部知识或额外训练成本的情况下,高效、通用地缓解大语言模型在生成内容中的幻觉现象,提升大语言模型生成答案的质量。
技术关键词
大语言模型
解码方法
解码算法
动态
随机采样方法
指数衰减函数
文本
生成答案
参数
强度
人工智能技术
焦点
中间层
线性
定义
信号
系统为您推荐了相关专利信息
GPU性能测试方法
执行矩阵乘法
模拟真实场景
数据
随机噪声
细胞悬液
细胞接种
混合凝胶
灌注培养基
细胞共培养模型
标准化模板
RPA机器人
模板生成方法
语义
数据查询请求