摘要
本发明涉及深度学习技术领域,公开一种基于拆分学习的端边云模型压缩与部署方法,包括:将深度学习模型拆分为前部模型、中部模型和后部模型,部署于客户端、边缘侧和云端;客户端对前部模型进行前向传播,将前向传播结果发送至边缘侧;边缘侧接收来自至少一个客户端的前向传播结果,利用中部模型对接收到的结果进行前向传播,将前向传播结果发送至云端;云端接收来自至少一个边缘侧的前向传播结果,利用后部模型完成前向传播,计算损失函数,进行反向传播,以更新前部模型、中部模型和后部模型;对前部模型、中部模型和后部模型进行迭代剪枝,并利用知识蒸馏对剪枝后的模型进行微调;将轻量化后的前部模型部署到客户端,以在客户端本地进行推理。
技术关键词
模型压缩
云端
深度学习模型
标签
知识蒸馏技术
学生
教师
深度学习技术
客户端设备
参数
样本
模型更新
逻辑
数据
度量
变量
资源
系统为您推荐了相关专利信息
页面缓存方法
页面数据
双缓存结构
滑动窗口技术
序列特征
数据插补方法
生成对抗网络
概率分布建模
逻辑回归算法
高斯混合模型
工业网络安全
信息熵
滑动时间窗口
日志采集方法
指令
联邦学习方法
分布式机器学习技术
梯度下降算法
差分隐私技术
数据分布