摘要
本发明涉及一种利用动态树结构投机解码加速大模型推理的方法和系统。该方法包括:采用小模型对输入的文字进行处理,生成树结构的预测字符;将输入的文字和小模型生成的预测字符一起输入大模型,通过大模型推理过程得到大模型的输出结果,并判断是否接收小模型生成的预测字符,从而得到最终生成的文本。本发明的树形推理结构能够利用期望接收概率更高的分叉节点,在增长推测长度的同时期望生成更多的令牌,从而达到加速大模型推理的目的;本发明的动态决定结束条件的设计可以在该方法表现不佳时候更快地结束,相比同类方法有更好的综合性能。
技术关键词
字符
节点
队列算法
存储计算机程序
可读存储介质
解码
动态
文本
浮点数
计算机设备
存储器
处理器
综合性
令牌
模块
指令
系统为您推荐了相关专利信息
抽水蓄能电站
出清方法
策略优化模型
抽水蓄能机组
功率
关键意见领袖
Agent技术
学习算法
组织
策略
信息完整性校验
访问控制信息
真实性校验
云平台
数字签名算法