一种基于边缘计算的大语言模型优化方法

AITNT
正文
推荐专利
一种基于边缘计算的大语言模型优化方法
申请号:CN202411525003
申请日期:2024-10-30
公开号:CN119026640A
公开日期:2024-11-26
类型:发明专利
摘要
本发明公开了一种基于边缘计算的大语言模型优化方法,属于机器学习领域,本发明在边缘计算的环境中,基于Transformer的大模型结构框架下,通过找寻模型推理的最佳分割点,从而将Transformer模型分割成底层部分和高层部分,在算力受限的用户设备上部署轻量化的底层模型,将计算密集型的高层模型部署在云端服务器上;通过找寻最优分割点,将Transformer模型在用户设备和云服务器上进行合理分割部署,从而实现计算资源利用的优化和响应延迟的降低。
技术关键词
语言模型优化方法 云端服务器 边缘计算环境 瑞利衰落信道 动态资源分配 蒙特卡罗树搜索 节点 策略 资源预留 结构框架 时间段 网络 决策 噪声 参数 结点 受限
系统为您推荐了相关专利信息
1
功能菜单的展示方法和装置、存储介质及电子设备
云端服务器 菜单 展示方法 横向联邦 节点
2
一种基于计算机视觉的摔倒检测系统及检测方法和移动电子设备
摔倒检测系统 计算机视觉 雷达模块 识别算法 关键点检测算法
3
一种智能宠物健康监测与智能评估系统
智能评估系统 智能宠物 数据融合算法 多传感器融合 混合推荐系统
4
一种降低铜箔在生产过程中折皱的方法
云端服务器 高清工业 深度学习算法 智能化监测系统 图像
5
基于数字孪生的多园区能耗预测调度方法及控制系统
数字孪生体 预测调度方法 能耗 云端服务器 微电网监控
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号