大模型推理方法、装置、设备及程序产品

正文

推荐专利

大模型推理方法、装置、设备及程序产品

申请号：CN202510032940

申请日期：2025-01-09

公开号：CN119416823B

公开日期：2025-04-11

类型：发明专利

摘要

本申请公开了一种大模型推理方法、装置、设备及程序产品，涉及人工智能技术领域，本申请在部署时选择稀疏性大模型作为待部署的大模型，进一步将其拆分为若干个子模型，并存储到终端的内存中。在执行大模型推理任务时，可以根据当前推理任务所需的目标子模型，从内存中仅加载目标子模型至推理芯片执行推理任务，无需加载全部的稀疏性大模型，极大降低了所需加载模型参数的数量，使得访存量降低，推理耗时也降低，有效缓解了内存墙问题。

技术关键词

推理方法内存排布方式前馈神经网络芯片终端推理装置人工智能技术计算机程序产品处理器加载单元关系数据可读存储介质存储器电子设备指令参数

大模型推理方法、装置、设备及程序产品

站点导航

APP 下载