摘要
本说明书实施例提供大语言模型推理方法、装置、设备、介质和产品。其中该方案包括:获取大语言模型在推理过程中所预测出的token序列,并基于该token序列判断大语言模型是否陷入了循环状态,若所述大语言模型陷入了循环状态,则通过干预机制强制性结束大语言模型的推理过程。该方案,可以避免大语言模型在推理过程中陷入循环状态,从而可以节省模型的计算资源以及推理时间,还可以提升模型所生成的文本的准确性,进而可以提升模型的整体推理性能。
技术关键词
大语言模型
序列
推理方法
机制
指令
推理装置
处理器
存储计算机程序
计算机程序产品
冗余
可读存储介质
存储器
模块
参数
文本
系统为您推荐了相关专利信息
抑制低频振荡
压缩空气储能系统
透平机
线性扩张状态观测器
附加阻尼控制器
温度预测模型
长短期记忆网络
变压器运行数据
温度预测方法
计算机可执行指令
离散相模型
壁面温度
结构化网格
热传导方程
耦合算法