摘要
本发明公开了一种用于推测性解码大语言模型的早退方法及计算系统,包括:从大语言模型中选取若干个解码层,在被选中的解码层之后设置预测器;在每次前向过程中,采用草案模型生成语义单元树,大语言模型的输入包括语义单元树中非叶子结点;判断某个被选中的解码层是否早退的过程中:获取所述预测器的输入,当所述预测器根据其输入判断可以早退时;从语义单元树的根节点开始向下搜索满足早退条件的早退路径;若找到满足早退条件的早退路径,则早退并将该早退路径上的各语义单元作为输出。本发明的技术方案将推测解码技术与早退技术相结合,可在精度无损的情况下获得良好的加速效果。
技术关键词
大语言模型
语义
节点
计算机可执行指令
结点
矩阵
解码技术
多层感知机
离线
存储器
在线
处理器
精度
系统为您推荐了相关专利信息
工业物联网数据
隐私计算方法
信号
故障类别
语义
场面监视系统
多模态
工作模式切换模块
信号
物体
外语学习系统
大语言模型
人机交互设备
状态监控模块
模板
文本段落
编码向量
语义相关度
节点
文本生成方法