摘要
本发明公开了一种基于边缘计算的大语言模型优化方法,属于机器学习领域,本发明在边缘计算的环境中,基于Transformer的大模型结构框架下,通过找寻模型推理的最佳分割点,从而将Transformer模型分割成底层部分和高层部分,在算力受限的用户设备上部署轻量化的底层模型,将计算密集型的高层模型部署在云端服务器上;通过找寻最优分割点,将Transformer模型在用户设备和云服务器上进行合理分割部署,从而实现计算资源利用的优化和响应延迟的降低。
技术关键词
语言模型优化方法
云端服务器
边缘计算环境
瑞利衰落信道
动态资源分配
蒙特卡罗树搜索
节点
策略
资源预留
结构框架
时间段
网络
决策
噪声
参数
结点
受限
系统为您推荐了相关专利信息
摔倒检测系统
计算机视觉
雷达模块
识别算法
关键点检测算法
智能评估系统
智能宠物
数据融合算法
多传感器融合
混合推荐系统
云端服务器
高清工业
深度学习算法
智能化监测系统
图像
数字孪生体
预测调度方法
能耗
云端服务器
微电网监控