摘要
本申请涉及计算机技术领域,特别是涉及一种基于低秩张量适应的模型微调训练方法、模型应用方法及相关装置。一个实施例的基于低秩张量适应的模型微调训练方法包括:获取预训练模型;为所述预训练模型的模型参数添加微调参数,获得多个微调参数矩阵,并将所述多个微调参矩阵合并为一个微调参数张量并分解为一个核心张量与两个低秩因子矩阵;冻结两个所述低秩因子矩阵以及所述模型参数,获得待训练模型;通过样本数据对所述待训练模型进行微调训练,在训练过程中对所述核心张量进行调整,获得训练后的目标模型。采用本申请实施例能够减少了在针对预训练模型进行模型微调时需要调整的参数的数量,减少了参数微调的成本。
技术关键词
预训练模型
矩阵
参数
因子
核心
样本
数据获取模块
训练装置
处理器
计算机设备
可读存储介质
存储器
标签
系统为您推荐了相关专利信息
主成分分析技术
矩阵
检测成像方法
聚焦算法
数据
贝叶斯神经网络
故障预测方法
电厂设备
预测残差
设备运行状态
堆叠结构
可视化界面
集成电路芯片
展示方法
集成电路版图