摘要
本申请涉及计算机技术领域,特别是涉及一种基于动态低秩张量适应的模型微调训练方法、模型应用方法及相关装置。一个实施例的基于动态低秩张量适应的模型微调训练方法包括:获取预训练模型;为预训练模型的模型参数添加微调参数获得不同层的微调参数矩阵,将多个层的微调参数矩阵合并为一个微调参数张量并分解为一个核心张量与两个低秩因子矩阵,获得待微调参数;通过样本数据对预训练模型进行微调,在微调过程中冻结预训练模型的原始参数,按顺序对核心张量与两个低秩因子矩阵进行更新,并对更新后的核心张量的切片矩阵进行低秩调整,获得更新后的微调参数。采用本实施例的方案,可以在减少参数微调成本的同时还可以进一步提高得到的模型的性能。
技术关键词
预训练模型
矩阵
参数
核心
因子
切片
动态
数据获取模块
训练装置
样本
计算机设备
存储器
处理器
元素
系统为您推荐了相关专利信息
相位校正方法
序列
语义特征提取
协方差矩阵
相位校正器
PCB设计文件
仿真方法
网络
简化仿真模型
元器件
控制实时监测系统
智能数据分析技术
设备运行数据
多参数传感器
监控中心