大语言模型推理加速方法、装置、设备及介质

AITNT
正文
推荐专利
大语言模型推理加速方法、装置、设备及介质
申请号:CN202511250810
申请日期:2025-09-03
公开号:CN121031794A
公开日期:2025-11-28
类型:发明专利
摘要
本申请公开一种大语言模型推理加速方法、装置、设备及介质,涉及模型加速技术领域,该方法包括:获取输入序列;基于输入序列,通过预训练语言模型的解码头获取第一预测token集合;基于输入序列,通过至少一个新增解码头并行获取至少一个后续预测token集合;基于第一预测token集合和至少一个后续预测token集合,生成所有候选token序列;基于输入序列,将每个候选token序列输入至预训练语言模型,计算每个候选token序列在预训练语言模型中的输出概率;基于输出概率及与每个候选token序列中对应预测位置相关联的新增解码头的预测概率,从所有候选token序列中确定目标输出序列。
技术关键词
预训练语言模型 序列 码头 大语言模型 特征提取模块 加速装置 处理器 动态 存储器 笛卡尔 可读存储介质 指标 电子设备 网络 计算机 策略 算法
系统为您推荐了相关专利信息
1
基于图像处理的输电线路巡检方法
输电线路巡检方法 像素点 导线 均值漂移算法 图像处理
2
一种低功耗的UWB解扩器实现装置
加法器 乘法器 数据选择器 低功耗 处理单元
3
一种信息搜索方法及系统、电子设备、存储介质
搜索意图 信息搜索方法 文本 多模态数据分析 图像
4
一种用于数字化智能电网的调度故障分析识别方法
分析识别方法 智能电网 电信号 指标 曲线
5
一种基于多粒度特征融合的代码摘要生成方法
代码摘要生成方法 多粒度特征 抽象语法树 编码器 代表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号