摘要
本申请提供了一种模型微调方法、装置、设备及计算机可读存储介质,该方法包括:利用通用数据集对预训练模型进行测试,得到预训练模型中各层的分类特性值;利用微调数据集分别对预训练模型中各层进行微调,得到预训练模型中各层的精度贡献值和各层的微调时长;求解最优层微调策略数学模型,得到最优层微调策略,最优层微调策略数学模型根据分类特性值、精度贡献值和微调时长构建。本申请通过对预训练模型进行微调,可以使预训练模型适应各种场景,利用预训练模型每层的精度贡献值确定微调策略,可以减小微调预训练模型的训练数据量,在提高训练效率和精度的同时,减少了计算成本。
技术关键词
预训练模型
数学模型
精度
策略
微调方法
微调单元
可读存储介质
遗传算法求解
训练数据量
存储计算机程序
微调装置
测试模块
存储器
计算机设备
处理器
场景
指令
系统为您推荐了相关专利信息
无人机集群控制
状态空间模型
穿越方法
非正交多址接入技术
动态避障
桥梁健康检测
桥梁健康监测系统
强化学习算法
强化学习模型
贪婪策略
多传感器融合
分拣机器人
机械臂系统
底盘系统
工件
多层线路板
自动化检测系统
数据分析平台
图像处理软件
原始图像数据
视频时空特征
文本生成方法
图像块
解码网络
矩阵