摘要
本申请提供一种深度学习模型的微调方法、计算机设备及介质。本申请通过对目标编码解码层的目标线性变换模块中设置低秩矩阵,利用深度学习模型的模型训练数据集,对低秩矩阵中的矩阵参数进行更新,以实现对深度学习模型的微调,避免了对深度学习模型中的所有模型参数均进行更新,以减少显卡内存占用和计算开销,提高模型微调的效率。
技术关键词
深度学习模型
微调方法
矩阵
显卡
参数
解码
计算机设备
编码
可读存储介质
模块
策略
处理器
存储器
数据
内存
尺寸
系统为您推荐了相关专利信息
外脚手架
智能检测系统
编码向量
图像块特征提取
图像特征提取
调优方法
日志数据库
超参数
网络结构
参数估计器
缺陷检测方法
橡胶气囊
机器视觉检测平台
检测网络模型
多视角成像系统
监测系统
柔性Laplacian电极
虚拟现实场景
多模态生理
协方差矩阵
水下牵引机
波浪滑翔机
运动预报方法
浮体
脐带缆