摘要
本申请公开了模型的微调方法及装置、电子设备和存储介质,涉及人工智能技术领域,分别获取至少两个服务器的第一低秩矩阵参数;第一低秩矩阵参数为利用服务器中的训练用数据对预训练模型的低秩矩阵进行训练得到的参数,不同服务器中的训练用数据各不相同;对至少两个第一低秩矩阵参数进行计算,得到第一全局低秩矩阵;将第一全局低秩矩阵分别发送至至少两个服务器,以便至少两个服务器基于第一全局低秩矩阵,对预训练模型进行微调,得到微调后的预训练模型。与相关技术相比,本申请实施例利用第一全局低秩矩阵对预训练模型进行微调,低秩矩阵能够降低模型的微调的复杂度,通过利用低秩矩阵与分布式训练相结合的方式,提高了模型的微调效率。
技术关键词
矩阵
服务器
预训练模型
微调方法
参数
分布式训练
电子设备
人工智能技术
数据
计算机程序产品
微调装置
处理器通信
指令
可读存储介质
存储器
复杂度