摘要
本发明涉及深度学习领域,提供一种模型微调方法、装置、电子设备及存储介质。所述方法包括:对基底模型进行模型解析,得到所述基底模型中各层网络的参数信息;基于配置信息和各所述参数信息,生成一个或多个插件网络;对各所述插件网络进行初始化;将初始化后的插件网络与所述基底模型进行组合,得到组合模型;对所述组合模型进行训练,基于训练结果,确定微调模型。本发明提供的模型微调方法、装置、电子设备及存储介质,通过插件网络实现微调模块的复用,从而降低模型微调成本投入,将多个插件网络与基底模型组合训练,提升模型预测准确性。
技术关键词
微调方法
插件
基底
中间层
非暂态计算机可读存储介质
电子设备
处理器
计算机程序产品
微调装置
组合模块
网络结构
模型库
存储器
脚本
格式
策略
参数
系统为您推荐了相关专利信息
存储优化方法
边缘控制器
副本
服务器
LSTM模型
滤光结构
图像传感器表面
处理器模块
人工神经网络模型
电信号