大语言模型推理加速方法、装置、设备及介质

正文

推荐专利

申请号：CN202511250810

申请日期：2025-09-03

公开号：CN121031794A

公开日期：2025-11-28

类型：发明专利

摘要

本申请公开一种大语言模型推理加速方法、装置、设备及介质，涉及模型加速技术领域，该方法包括：获取输入序列；基于输入序列，通过预训练语言模型的解码头获取第一预测token集合；基于输入序列，通过至少一个新增解码头并行获取至少一个后续预测token集合；基于第一预测token集合和至少一个后续预测token集合，生成所有候选token序列；基于输入序列，将每个候选token序列输入至预训练语言模型，计算每个候选token序列在预训练语言模型中的输出概率；基于输出概率及与每个候选token序列中对应预测位置相关联的新增解码头的预测概率，从所有候选token序列中确定目标输出序列。

技术关键词

预训练语言模型序列码头大语言模型特征提取模块加速装置处理器动态存储器笛卡尔可读存储介质指标电子设备网络计算机策略算法

系统为您推荐了相关专利信息

基于图像处理的输电线路巡检方法

输电线路巡检方法像素点导线均值漂移算法图像处理

一种低功耗的UWB解扩器实现装置

加法器乘法器数据选择器低功耗处理单元

一种信息搜索方法及系统、电子设备、存储介质

搜索意图信息搜索方法文本多模态数据分析图像

一种用于数字化智能电网的调度故障分析识别方法

分析识别方法智能电网电信号指标曲线

一种基于多粒度特征融合的代码摘要生成方法

代码摘要生成方法多粒度特征抽象语法树编码器代表

大语言模型推理加速方法、装置、设备及介质

站点导航

APP 下载