基于增量头参数融合的深度学习模型快速迭代方法

正文

推荐专利

申请号：CN202410712694

申请日期：2024-06-04

公开号：CN118569341A

公开日期：2024-08-30

类型：发明专利

摘要

本发明公开了基于增量头参数融合的深度学习模型快速迭代方法，包括以下步骤：步骤S1：构建基础模型，基于初始数据集从头训练得到模型权重；步骤S2：通过在基础模型上增加任务头来重构增量后的模型结构，加载初始训练模型权重，冻结基干网络和初始头的参数，在新域数据下训练微调增量头；步骤S3：通过网格搜索策略搜索加权参数组合，基于加权参数融合初始头和增量头的网络参数，并将模型结构进行还原，本发明能够大大缩短模型更新时间，同时保持较好的识别效果。该发明适用于多种任务的深度学习模型，例如图像分类、目标检测、语义分割等等，并能够灵活控制新域和旧域的表现能力。

技术关键词

深度学习模型迭代方法搜索模块数据网络结构网格重构模型更新基础头结构策略指标超参数语义样本阶段图像速度

基于增量头参数融合的深度学习模型快速迭代方法

站点导航

APP 下载