摘要
本申请在深度学习技术领域,公开了模型训练方法、任务处理方法、边缘端设备、介质及产品,该方法包括:在进入当前训练轮次后,将深度神经网络模型中二维矩阵形态的模型参数,分为停止更新参数和继续更新参数;删除停止更新参数的历史梯度信息,并基于继续更新参数的历史梯度信息,对继续更新参数进行更新;完成当前训练轮次的参数更新后,计算深度神经网络模型的当前损失值;利用当前损失值确定是否完成训练;如果是,则结束训练;如果否,则进入下一训练轮次。删除停止更新参数的历史梯度信息以降低显存占用,仅针对继续更新参数进行更新处理以降低计算量。本申请在不违反隐私保护的前提下,实现边缘端设备的深度神经网络模型的有效微调。
技术关键词
深度神经网络模型
参数
模型训练方法
矩阵
深度学习技术
可读存储介质
存储计算机程序
计算机程序产品
处理器
形态
平台
标签
样本
指令
服务器
存储器
数据
系统为您推荐了相关专利信息
超级电容
电学性能参数
自动检测系统
超声波检测模块
视觉检测模块
校准特征
图像分类方法
卷积神经网络提取
生成噪声
分类器
对象
图像采集参数
语义特征
融合特征
深度值信息