利用动态树结构投机解码加速大模型推理的方法和系统

AITNT
正文
推荐专利
利用动态树结构投机解码加速大模型推理的方法和系统
申请号:CN202411583047
申请日期:2024-11-07
公开号:CN119721235A
公开日期:2025-03-28
类型:发明专利
摘要
本发明涉及一种利用动态树结构投机解码加速大模型推理的方法和系统。该方法包括:采用小模型对输入的文字进行处理,生成树结构的预测字符;将输入的文字和小模型生成的预测字符一起输入大模型,通过大模型推理过程得到大模型的输出结果,并判断是否接收小模型生成的预测字符,从而得到最终生成的文本。本发明的树形推理结构能够利用期望接收概率更高的分叉节点,在增长推测长度的同时期望生成更多的令牌,从而达到加速大模型推理的目的;本发明的动态决定结束条件的设计可以在该方法表现不佳时候更快地结束,相比同类方法有更好的综合性能。
技术关键词
字符 节点 队列算法 存储计算机程序 可读存储介质 解码 动态 文本 浮点数 计算机设备 存储器 处理器 综合性 令牌 模块 指令
系统为您推荐了相关专利信息
1
用于风电场等值的电网安全校核方法及装置
风电机组 基准 校核方法 偏差 参数
2
电机优化方法、装置、电子设备及存储介质
响应面模型 工况参数 物理 采样点 克里金模型
3
一种抽水蓄能电站的联合优化出清方法、装置、终端设备及存储介质
抽水蓄能电站 出清方法 策略优化模型 抽水蓄能机组 功率
4
一种基于知识图谱的影响力预测方法及系统
关键意见领袖 Agent技术 学习算法 组织 策略
5
电网调度云平台的数据访问方法、装置、计算机设备、可读存储介质
信息完整性校验 访问控制信息 真实性校验 云平台 数字签名算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号