摘要
本申请公开了一种大模型训练策略的确定方法、装置及电子设备。涉及人工智能领域,该方法包括:获取待训练模型对应的硬件参数信息、模型参数信息以及训练参数信息;采用第一训练框架基于硬件参数信息、模型参数信息以及训练参数信息确定第一训练策略,并采用第二训练框架基于硬件参数信息、模型参数信息以及训练参数信息确定第二训练策略,其中,第一训练框架和第二训练框架对应的训练算法不同;依据预设训练步数和预设数据集,从第一训练策略和第二训练策略中确定待训练模型对应的目标训练策略。本申请解决了相关技术中基于专家经验确定模型的训练策略,存在确定出的训练策略准确性较低的技术问题。
技术关键词
策略
框架
训练算法
流水线
数据
电子设备
可读存储介质
计算机程序产品
客户端
生成方法
处理器
指令
服务器
存储器
序列