一种模型微调方法、装置、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202411437447

申请日期：2024-10-15

公开号：CN119415948A

公开日期：2025-02-11

类型：发明专利

摘要

本申请提供了一种模型微调方法、装置、设备及计算机可读存储介质，该方法包括：利用通用数据集对预训练模型进行测试，得到预训练模型中各层的分类特性值；利用微调数据集分别对预训练模型中各层进行微调，得到预训练模型中各层的精度贡献值和各层的微调时长；求解最优层微调策略数学模型，得到最优层微调策略，最优层微调策略数学模型根据分类特性值、精度贡献值和微调时长构建。本申请通过对预训练模型进行微调，可以使预训练模型适应各种场景，利用预训练模型每层的精度贡献值确定微调策略，可以减小微调预训练模型的训练数据量，在提高训练效率和精度的同时，减少了计算成本。

技术关键词

预训练模型数学模型精度策略微调方法微调单元可读存储介质遗传算法求解训练数据量存储计算机程序微调装置测试模块存储器计算机设备处理器场景指令

系统为您推荐了相关专利信息

无人机集群自主穿越方法及系统

无人机集群控制状态空间模型穿越方法非正交多址接入技术动态避障

基于强化学习的桥梁健康检测方法及桥梁健康监测系统

桥梁健康检测桥梁健康监测系统强化学习算法强化学习模型贪婪策略

一种多传感器融合的自动分拣机器人

多传感器融合分拣机器人机械臂系统底盘系统工件

一种检查多层线路板层间错位的设计方法

多层线路板自动化检测系统数据分析平台图像处理软件原始图像数据

文本生成方法、装置、设备及介质

视频时空特征文本生成方法图像块解码网络矩阵

一种模型微调方法、装置、设备及计算机可读存储介质

站点导航

APP 下载