一种基于渐进起草树的大语言模型推理加速方法及系统

AITNT
正文
推荐专利
一种基于渐进起草树的大语言模型推理加速方法及系统
申请号:CN202510804204
申请日期:2025-06-17
公开号:CN120654833A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种基于渐进起草树的大语言模型推理加速方法及系统,所述方法包括:构建初始起草树,初始起草树的根节点关联已解码的上下文序列,其余节点通过随机初始化生成扰动词元;基于节点之间的依赖关系设置注意力掩码和位置编码,使得每个节点仅能关注其所在路径上的前序节点;利用大语言模型对初始起草树进行推理,生成草稿词元,并根据草稿词元扩展起草树及更新候选池;通过预设宽度约束和深度约束对扩展后的起草树进行剪枝;从候选池中提取候选草稿树。本发明通过将传统自回归的单步预测任务转化为并行的起草和验证过程,提出基于渐进起草树的草稿生成机制,在保持原始的模型架构和参数的情况下实现了高效的推理加速。
技术关键词
节点 大语言模型 非暂态计算机可读存储介质 注意力 加速系统 生成机制 处理器 有效性 解码 关系 编码 序列 语义 模块 存储器 电子设备 层级 规模 程序 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号