摘要
本发明涉及模型参数微调技术领域,公开了一种用于密集预测任务的视觉基础模型的参数高效微调方法,包括:为视觉基础模型引入动态参数生成模块,并在视觉基础模型的每一个transformer层的多头注意力模块和前馈神经网络上并行的添加HOM模块;动态参数生成模块中的每个超网络为对应的卷积层生成卷积核参数;在视觉基础模型进行微调训练时,视觉基础模型的参数保持冻结,通过密集预测任务训练图像对HOM模块和动态参数生成模块的参数进行训练。本发明有效地降低将视觉基础模型应用于密集预测任务时所消耗的资源,降低了显存的花费以及训练时间。
技术关键词
微调方法
视觉
像素点
基础
前馈神经网络
超网络
模块
图像
输出特征
代表
动态
微调技术
注意力
矩阵
超参数
元素
通道
核心
系统为您推荐了相关专利信息
分类卷积神经网络
图像分类模型
卷积神经网络训练
均匀量化方法
参数
图像语义分析
频谱特征提取
纹理
光学图像数据
光学成像设备