摘要
本公开提供了一种大语言模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及大模型、深度学习和云计算领域。具体实现方案为:获取低秩适应LoRA网络的秩大小,并根据秩大小确定LoRA网络的缩放参数范围;根据秩大小,确定LoRA网络的可学习参数的多个候选缩放参数;从多个候选缩放参数中,确定LoRA网络的目标缩放参数;基于目标缩放参数更新LoRA网络,并基于更新后LoRA网络对预训练的大语言模型进行微调训练,直至得到目标大语言模型。
技术关键词
缩放参数
大语言模型
网络
矩阵乘法运算
电子设备
模块
人工智能技术
计算机程序产品
训练装置
处理器通信
指令
可读存储介质
分支
存储器
阶段