大模型训练策略的确定方法、装置及电子设备

正文

推荐专利

申请号：CN202411838913

申请日期：2024-12-12

公开号：CN119830005A

公开日期：2025-04-15

类型：发明专利

摘要

本申请公开了一种大模型训练策略的确定方法、装置及电子设备。涉及人工智能领域，该方法包括：获取待训练模型对应的硬件参数信息、模型参数信息以及训练参数信息；采用第一训练框架基于硬件参数信息、模型参数信息以及训练参数信息确定第一训练策略，并采用第二训练框架基于硬件参数信息、模型参数信息以及训练参数信息确定第二训练策略，其中，第一训练框架和第二训练框架对应的训练算法不同；依据预设训练步数和预设数据集，从第一训练策略和第二训练策略中确定待训练模型对应的目标训练策略。本申请解决了相关技术中基于专家经验确定模型的训练策略，存在确定出的训练策略准确性较低的技术问题。

技术关键词

策略框架训练算法流水线数据电子设备可读存储介质计算机程序产品客户端生成方法处理器指令服务器存储器序列

大模型训练策略的确定方法、装置及电子设备

站点导航

APP 下载