摘要
本公开提供了解码加速方法、装置、设备、计算机可读存储介质及产品,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:获取终端设备发送的待预测文本;将待预测文本输入至大语言模型中预设的编码层,获得编码层输出的待预测文本对应的第一隐藏状态;通过大语言模型中的语言模型头以及预设的多头模型基于第一隐藏状态进行解码操作,生成多个预测文本,多头模型中包括多个解码模块,解码模块包括多层感知机以及语言模型头,多个解码模块复用语言模型头;基于大语言模型对多个预测文本进行验证操作,将验证通过的多个目标预测文本发送至终端设备。从而提高了大语言模型在解码阶段的速度,提高了大语言模型进行数据处理的效率。
技术关键词
解码模块
文本
大语言模型
解码加速方法
多层感知器
解码单元
终端设备
数据
多层感知机
编码
可读存储介质
输入模块
处理器
加速装置
计算机程序产品
拼接单元
参数
系统为您推荐了相关专利信息
音频
车辆控制指令
服务器设备
识别语音信息
座舱
食品营养检测
注意力机制
融合特征
特征金字塔网络
视觉特征
待测器件
电压测试方法
文本识别模型
功率器件
电压测试系统
时空分布图
积水
背景噪声干扰
上下文特征
监控视频图像