一种大语言模型推理方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510549064

申请日期：2025-04-28

公开号：CN120633822A

公开日期：2025-09-12

类型：发明专利

摘要

本发明提供一种大语言模型推理方法、装置、电子设备及存储介质，其中方法包括：在接收到当前请求的情况下，根据映射表查找存储空间中与已存储的各个请求对应的历史高存储效率张量，将历史高存储效率张量转换为历史目标张量；根据当前请求通过大语言模型执行当前轮推理，获取当前轮推理过程中大语言模型各层对应的中间张量，在中间张量中获取大语言模型的注意力层计算需要的当前目标张量；查找作为当前目标张量前驱的当前高存储效率张量，将当前请求以及对应的当前高存储效率张量作为历史中间数据保存至存储空间，并更新映射表；将历史目标张量和当前目标张量输入至注意力层进行计算，得到当前请求对应的推理文本，有效减少了冗余计算。

技术关键词

大语言模型推理方法注意力推理系统硬件加速器文本非暂态计算机可读存储介质访问存储空间字符数据电子设备推理装置处理器计算机程序产品队列转换单元关系存储器曲线拷贝

系统为您推荐了相关专利信息

生产线管理方法、电子设备

实时图像管理方法机器人注意力参数数据

对小说进行信息提取和汇总的方法、电子设备和存储介质

大语言模型文本知识图谱数据库构建知识图谱电子设备

一种基于大语言模型的养老智能服务终端

智能服务终端大语言模型屏幕显示模块鼾声检测姿势识别

大语言模型确定方法、装置及程序产品

大语言模型高斯分布模型数据计算机程序产品阶段

表格问答方法、装置、电子设备及存储介质

问答方法表格键值字典代码解释器

一种大语言模型推理方法、装置、电子设备及存储介质

站点导航

APP 下载