摘要
本公开提供了一种大模型的微调方法及装置、电子设备、介质、产品,该方法包括:获取所述大模型中待调整的模型参数对应的第一增量矩阵;根据所述第一增量矩阵的损失值,对所述第一增量矩阵进行更新,根据更新后的第一增量矩阵,确定所述待调整的模型参数的矩阵秩预算;根据所述待调整的模型参数的矩阵秩预算,对所述更新后的第一增量矩阵进行降秩处理,得到第二增量矩阵,通过所述第二增量矩阵对所述待调整的模型参数进行微调;其中,所述待调整的模型参数的矩阵秩预算用于确定所述待调整的模型参数对应的第二增量矩阵的秩。该方式能够针对不同的模型参数灵活确定增量矩阵的秩,从而兼顾大模型的整体性能和准确性。
技术关键词
矩阵
元素
数据处理模型
参数
微调方法
计算机可读代码
功能模块
中央处理器执行
电子设备
微调装置
阶段
可读存储介质
图形处理器
数据处理装置
数据处理方法
数据处理模块
计算机程序产品
文本
处理器通信
系统为您推荐了相关专利信息
解码器
图像分割方法
医学图像分割模型
适配器
编码器
纠错编码方法
纠错编码方案
纠错编码算法
监控存储设备
纠错编码设备
光纤振动传感
水工结构
可拆卸模型
振动平台
测试平台
数据分析方法
剪枝模型
时序
数据分析系统
数据压缩方法
主汽压力
火电
机组
辅机故障减负荷
协调控制系统