摘要
本发明实施例公开了一种大语言模型中的推测性解码方法、装置、设备及介质。该方法包括:在内存中读取历史文本信息,并传输至计算单元;在计算单元中执行:将历史文本信息输入至预设长度预测器,得到推理长度;将推理长度以及历史文本信息输入至预设推测性解码模型,得到与推理长度相同个数的预测文本信息;将历史文本信息输入至大语言模型中,得到大语言模型输出的目标文本信息;将历史文本信息、目标文本信息以及各预测文本信息输入至大语言模型进行验证,得到推理正确的目标预测文本信息;根据历史文本信息与目标预测文本信息进行迭代训练,得到目标长度预测器和目标推测性解码模型。该方法在推测性解码中考虑了推理长度,可提高模型推理性能。
技术关键词
解码模型
大语言模型
解码方法
文本信息传输
编码向量
模型训练模块
可读存储介质
计算机程序产品
解码装置
信息验证
内存
电子设备
处理器通信
网络
存储器