摘要
本公开涉及一种模型训练方法及装置、电子设备和存储介质,所述方法包括:确定第一模型训练框架,其中,所述第一模型训练框架为调用第一GPU进行模型训练的模型训练框架,所述第一模型训练框架是对第二模型训练框架进行参数转换后得到的,所述第二模型训练框架为调用第二GPU进行模型训练的模型训练框架,其中,所述第一GPU和所述第二GPU为不同类型架构配置的GPU;基于所述第一模型训练框架,调用所述第一GPU进行模型预训练。本公开实施例可以有效使得第一GPU具备基于第一模型训练框架进行大模型预训练的能力。
技术关键词
框架
模型预训练
模型训练方法
计算机程序指令
应用程序编程接口
加速器
模型训练装置
电子设备
软件
处理器
参数
可读存储介质
存储器
标签
模块