摘要
一种基于预生成token的星载大模型投机解码方法和装置,其方法包含:步骤1)离线预生成所有token的下一个token,得到预生成token字典对;步骤2)推理时,通过步骤1)猜测之后的token序列,并使用文本生成模型进行验证猜测到的序列,在模型在线推理生成token的时候,依据token字典对进行token查询,猜测生成之后的token,在线验证token预生成模块猜测得到的token正确性,当验证成功之后,即接受猜测的token,从而实现大模型token解码的加速生成。本发明在线推理时进行token查询猜测,并进行验证,提高大模型每一次推理时得到的正确token数量,从而加快token的生成速度。
技术关键词
文本生成模型
解码方法
序列
字典
键值
神经网络结构
在线
解码系统
离线
解码装置
注意力机制
模块
处理器
可读存储介质
存储器
程序
端点
信号
计算机
系统为您推荐了相关专利信息
饲料投放量
递归神经网络
预测模型构建方法
循环神经网络模型
注意力编码器
价格评估方法
业务系统
时间序列预测模型
收益预测方法
单周期
结构化查询语言
管理工具
数据处理方法
脚本
字典