一种大语言模型的推理方法以及装置

正文

推荐专利

一种大语言模型的推理方法以及装置

申请号：CN202410773361

申请日期：2024-06-14

公开号：CN121009974A

公开日期：2025-11-25

类型：发明专利

摘要

本申请实施例公开了一种大语言模型的推理方法以及装置，用于提升大语言模型的推理计算效率。本申请实施例方法包括：接收推理任务，推理任务携带语素编号，语素编号用于标识待进行推理计算的语素，语素包括基于大语言模型的输入文本确定的一个或多个子词。基于推理任务对应的语素编号查询全局索引树，确定目标推理节点，全局索引树包括分布式推理集群中多个推理节点对应的子树，目标推理节点对应的子树为全局索引树中与语素编号的相似匹配度大于阈值的子树，相似匹配度指示推理计算中可复用的键值缓存数据数量。基于目标推理节点执行推理任务。

技术关键词

大语言模型键值节点神经网络处理单元索引文本推理方法集群图形处理单元数据处理单元计算机程序产品处理器指令推理装置词语分词关系

系统为您推荐了相关专利信息

一种机组组合优化问题的训练数据增强和快速生成方法

快速生成方法新能源场站电力系统机组组合机组组合模型样本

基于脉冲神经网络的图像分析方法及相关装置

脉冲图像分析方法模块节点局部特征提取

一种基于嵌入式注意力策略和多层次编码网络的无人机控制方法

无人机控制方法多层次网络编码邻居

一种基于临床辅助决策的手术麻醉信息预警方法及系统

神经肌肉功能临床辅助决策患者面部信息预警方法

一种多重降维下应用红嘴蓝鹊算法的电网故障诊断方法

电网故障诊断方法信息编码节点算法断路器

一种大语言模型的推理方法以及装置

站点导航

APP 下载