一种大语言模型中的推测性解码方法、装置、设备及介质

正文

推荐专利

申请号：CN202410820882

申请日期：2024-06-24

公开号：CN118734970A

公开日期：2024-10-01

类型：发明专利

摘要

本发明实施例公开了一种大语言模型中的推测性解码方法、装置、设备及介质。该方法包括：在内存中读取历史文本信息，并传输至计算单元；在计算单元中执行：将历史文本信息输入至预设长度预测器，得到推理长度；将推理长度以及历史文本信息输入至预设推测性解码模型，得到与推理长度相同个数的预测文本信息；将历史文本信息输入至大语言模型中，得到大语言模型输出的目标文本信息；将历史文本信息、目标文本信息以及各预测文本信息输入至大语言模型进行验证，得到推理正确的目标预测文本信息；根据历史文本信息与目标预测文本信息进行迭代训练，得到目标长度预测器和目标推测性解码模型。该方法在推测性解码中考虑了推理长度，可提高模型推理性能。

技术关键词

解码模型大语言模型解码方法文本信息传输编码向量模型训练模块可读存储介质计算机程序产品解码装置信息验证内存电子设备处理器通信网络存储器

系统为您推荐了相关专利信息

基于数据扩展的软件工程智能体构建方法及装置

体构建方法强化学习方法大语言模型离线数据

一种基于加权计算的工单数据智能打标方法

打标方法数据指数列表大语言模型

三维场景图谱中物体节点信息的生成方法及系统

编码向量节点生成方法图谱场景

直播间公屏表情信息交互方法及其装置、设备、介质

信息交互方法定制界面入口身份自定义表情

一种用于大语言模型的提示注入攻击测试用例获得方法

大语言模型恶意样本指令编码器多轮对话

一种大语言模型中的推测性解码方法、装置、设备及介质

站点导航

APP 下载