摘要
本发明公开了基于智能代理的流水线分配自动搜索方法,属于分布式训练技术领域,具体地:利用性能分析模块获取目标大模型在集群设备上的执行时间,计算目标大模型中各神经网络层的通信时间;构建大语言模型,结合经验数据库,自动生成迭代搜索流水线分配策略。本发明无需进行模型训练,可直接应用进行流水线并行,从而解决现有技术求解速度慢且需在线训练以及无法直接适配新模型的问题;本发明可提升目标大模型的并行训练效率,保证搜索效果的情况下显著缩短搜索时间,并且搜索时间仅随pp的扩大而增加,几乎不受目标大模型的神经网络层总层数的影响,具有良好的通用性与鲁棒性。
技术关键词
自动搜索方法
流水线
大语言模型
策略
阶段
分布式训练
分析模块
批量
数据格式
网络结构
集群
鲁棒性
在线
序列
指令