一种支持并行热切换的大模型训练方法及系统

正文

推荐专利

申请号：CN202411501855

申请日期：2024-10-25

公开号：CN119558371A

公开日期：2025-03-04

类型：发明专利

摘要

本发明公开一种支持并行热切换的大模型训练方法及系统，属于大模型训练技术领域。所述方法包括：生成一逻辑计算图，所述逻辑计算图用于表示多组不同的并行策略组合；编译所述逻辑计算图，生成多个可执行计算图；其中，每一个可执行计算图对应一组并行策略组合；在多个可执行计算图中选取用于初始化大模型状态的初始化图，并根据任两组并行策略组合之间热切换代价，编排可执行计算图之间的执行顺序；基于所述初始化图以及可执行计算图之间的执行顺序进行大模型的训练。本发明不仅可以保证每个分组内的序列计算量/工作负载大致接近，还可以使得并行策略能够在模型训练过程中动态地切换，并正常完成模型的梯度累积和更新。

技术关键词

并行策略通信量模型训练方法逻辑参数切片通信带宽模型训练技术模型训练系统数据发送方点对点布局序列动态地模块消息拷贝内核

系统为您推荐了相关专利信息

基于多模型的水生态系统健康评价与预测系统

决策支持单元水生态系统多模型预测系统水质监测单元

基于工业物联网的车间巡检方法、系统、设备及介质

巡检设备巡检机器人粉尘浓度监测监测点巡检方法

一种基于决策树的计算机化自适应诊断测试生成方法

结点线性规划模型测试生成方法项目曝光率

基于5G新通话的数字人与人工客服实时协同系统及方法

服务终端 IMS核心网视频文本协同系统

一种中压配网电缆线路故障定位方法

波形基准信号电缆故障定位精度可定位故障点

一种支持并行热切换的大模型训练方法及系统

站点导航

APP 下载