基于增量头参数融合的深度学习模型快速迭代方法

AITNT
正文
推荐专利
基于增量头参数融合的深度学习模型快速迭代方法
申请号:CN202410712694
申请日期:2024-06-04
公开号:CN118569341A
公开日期:2024-08-30
类型:发明专利
摘要
本发明公开了基于增量头参数融合的深度学习模型快速迭代方法,包括以下步骤:步骤S1:构建基础模型,基于初始数据集从头训练得到模型权重;步骤S2:通过在基础模型上增加任务头来重构增量后的模型结构,加载初始训练模型权重,冻结基干网络和初始头的参数,在新域数据下训练微调增量头;步骤S3:通过网格搜索策略搜索加权参数组合,基于加权参数融合初始头和增量头的网络参数,并将模型结构进行还原,本发明能够大大缩短模型更新时间,同时保持较好的识别效果。该发明适用于多种任务的深度学习模型,例如图像分类、目标检测、语义分割等等,并能够灵活控制新域和旧域的表现能力。
技术关键词
深度学习模型 迭代方法 搜索模块 数据 网络结构 网格 重构 模型更新 基础 头结构 策略 指标 超参数 语义 样本 阶段 图像 速度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号