一种基于边缘计算的大语言模型优化方法

正文

推荐专利

一种基于边缘计算的大语言模型优化方法

申请号：CN202411525003

申请日期：2024-10-30

公开号：CN119026640A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了一种基于边缘计算的大语言模型优化方法，属于机器学习领域，本发明在边缘计算的环境中，基于Transformer的大模型结构框架下，通过找寻模型推理的最佳分割点，从而将Transformer模型分割成底层部分和高层部分，在算力受限的用户设备上部署轻量化的底层模型，将计算密集型的高层模型部署在云端服务器上；通过找寻最优分割点，将Transformer模型在用户设备和云服务器上进行合理分割部署，从而实现计算资源利用的优化和响应延迟的降低。

技术关键词

语言模型优化方法云端服务器边缘计算环境瑞利衰落信道动态资源分配蒙特卡罗树搜索节点策略资源预留结构框架时间段网络决策噪声参数结点受限

系统为您推荐了相关专利信息

功能菜单的展示方法和装置、存储介质及电子设备

云端服务器菜单展示方法横向联邦节点

一种基于计算机视觉的摔倒检测系统及检测方法和移动电子设备

摔倒检测系统计算机视觉雷达模块识别算法关键点检测算法

一种智能宠物健康监测与智能评估系统

智能评估系统智能宠物数据融合算法多传感器融合混合推荐系统

一种降低铜箔在生产过程中折皱的方法

云端服务器高清工业深度学习算法智能化监测系统图像

基于数字孪生的多园区能耗预测调度方法及控制系统

数字孪生体预测调度方法能耗云端服务器微电网监控

一种基于边缘计算的大语言模型优化方法

站点导航

APP 下载