一种大语言模型的边缘部署方法

AITNT
正文
推荐专利
一种大语言模型的边缘部署方法
申请号:CN202510179840
申请日期:2025-02-19
公开号:CN120123079A
公开日期:2025-06-10
类型:发明专利
摘要
本发明提供一种大语言模型的边缘部署方法,包括:S1、获取大语言模型的子层参数,包括多层子层、各个子层的存储需求量和输出数据量;S2、获取边缘计算集群所含多个边缘设备的设备信息,其包括各个设备的存储空间和带宽;S3、获取基于设备信息预设的约束条件,采用流水线并行的部署方式,根据子层参数和约束条件将多层子层分配到各个设备中,得到部署方案,其包括为各个设备分配的一层或连续的多层子层,并以最小化集群中的并行处理延迟为优化目标,迭代调整部署方案;S4、根据S3调整后的部署方案,将多层子层部署到各个设备中。本发明预设约束条件,以最小化并行处理延迟来调整部署方案,解决传统方法不适用部署大语言模型、计算效率低的问题。
技术关键词
大语言模型 动态规划算法 集群 贪心算法 流水线 校正 参数 处理器 可读存储介质 存储器 电子设备 指令 变量 计算机 数据
系统为您推荐了相关专利信息
1
基于物联网的矿山设备智能运维管理及预测分析系统
矿山设备智能 预测分析系统 集群 指数 重构模块
2
基于大语言模型的问答方法及相关设备
大语言模型 识别用户意图 问答方法 答案 记忆
3
服务运营调度方法、装置、电子设备及存储介质
运营调度方法 场景 因子 可读存储介质 大语言模型
4
一种服务器和服务器集群
加速卡 数据交互通道 服务器集群 端口 人工智能服务器
5
模型蒸馏方法、答复信息生成方法及装置
样本 答案 模型蒸馏方法 推理算法 信息生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号