一种大语言模型的边缘部署方法

正文

推荐专利

一种大语言模型的边缘部署方法

申请号：CN202510179840

申请日期：2025-02-19

公开号：CN120123079A

公开日期：2025-06-10

类型：发明专利

摘要

本发明提供一种大语言模型的边缘部署方法，包括：S1、获取大语言模型的子层参数，包括多层子层、各个子层的存储需求量和输出数据量；S2、获取边缘计算集群所含多个边缘设备的设备信息，其包括各个设备的存储空间和带宽；S3、获取基于设备信息预设的约束条件，采用流水线并行的部署方式，根据子层参数和约束条件将多层子层分配到各个设备中，得到部署方案，其包括为各个设备分配的一层或连续的多层子层，并以最小化集群中的并行处理延迟为优化目标，迭代调整部署方案；S4、根据S3调整后的部署方案，将多层子层部署到各个设备中。本发明预设约束条件，以最小化并行处理延迟来调整部署方案，解决传统方法不适用部署大语言模型、计算效率低的问题。

技术关键词

大语言模型动态规划算法集群贪心算法流水线校正参数处理器可读存储介质存储器电子设备指令变量计算机数据

系统为您推荐了相关专利信息

基于物联网的矿山设备智能运维管理及预测分析系统

矿山设备智能预测分析系统集群指数重构模块

基于大语言模型的问答方法及相关设备

大语言模型识别用户意图问答方法答案记忆

服务运营调度方法、装置、电子设备及存储介质

运营调度方法场景因子可读存储介质大语言模型

一种服务器和服务器集群

加速卡数据交互通道服务器集群端口人工智能服务器

模型蒸馏方法、答复信息生成方法及装置

样本答案模型蒸馏方法推理算法信息生成方法

一种大语言模型的边缘部署方法

站点导航

APP 下载