摘要
本发明涉及大模型训练技术领域,提供了一种云边端的训练框架,该框架在保证预训练LLM泛化性不受影响的情况下,提升了其为用户提供个性化服务的能力,采用拆分学习的方式,很好地与大型模型的分布式部署集成。框架在云服务器上部署了集成微调模块的LLM,同时在每个终端设备与其对应的边缘服务器上以拆分学习的方式部署规模相对较小的深度神经网络。深度神经网络与LLM以串行的方式进行协作训练和推理;采用对拆分层决策和资源调度进行优化的方式,在大时间尺度上使用拆分层决策优化算法,在小时间尺度上使用联合计算和频谱资源分配优化算法,从两个维度降低云边端协同训练的训练延迟。
技术关键词
终端设备
协作训练方法
云服务器
深度神经网络模型
参数
矩阵
资源分配优化算法
标签
分层
深度神经网络训练
适配器
设备端
决策
模型训练技术
框架
数据输入设备
通信链路
系统为您推荐了相关专利信息
智能化模具
扫描控制参数
控制终端设备
轮廓数据
截面轮廓
MRAM芯片
自动化测试系统
自动化测试方法
测试主机
转接板