一种基于预生成token的星载大模型投机解码方法和装置

AITNT
正文
推荐专利
一种基于预生成token的星载大模型投机解码方法和装置
申请号:CN202411017441
申请日期:2024-07-29
公开号:CN118569207B
公开日期:2024-11-08
类型:发明专利
摘要
一种基于预生成token的星载大模型投机解码方法和装置,其方法包含:步骤1)离线预生成所有token的下一个token,得到预生成token字典对;步骤2)推理时,通过步骤1)猜测之后的token序列,并使用文本生成模型进行验证猜测到的序列,在模型在线推理生成token的时候,依据token字典对进行token查询,猜测生成之后的token,在线验证token预生成模块猜测得到的token正确性,当验证成功之后,即接受猜测的token,从而实现大模型token解码的加速生成。本发明在线推理时进行token查询猜测,并进行验证,提高大模型每一次推理时得到的正确token数量,从而加快token的生成速度。
技术关键词
文本生成模型 解码方法 序列 字典 键值 神经网络结构 在线 解码系统 离线 解码装置 注意力机制 模块 处理器 可读存储介质 存储器 程序 端点 信号 计算机
系统为您推荐了相关专利信息
1
基于双向递归神经网络的饲料投放量预测及模型构建方法
饲料投放量 递归神经网络 预测模型构建方法 循环神经网络模型 注意力编码器
2
一种基于大语言模型实现的稠密编码器的处理方法和装置
编码器 分词 文本 大语言模型 掩膜矩阵
3
一种数据资产价格评估方法及系统
价格评估方法 业务系统 时间序列预测模型 收益预测方法 单周期
4
一种基于多模型融合的时间序列异常检测方法
注意力机制 序列 多模型 掩码矩阵 复杂度
5
数据库的数据处理方法及装置、电子设备和存储介质
结构化查询语言 管理工具 数据处理方法 脚本 字典
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号