一种面向集群的大模型并行方法、装置和电子装置

正文

推荐专利

申请号：CN202510788730

申请日期：2025-06-13

公开号：CN120353601B

公开日期：2025-09-16

类型：发明专利

摘要

本申请涉及一种面向集群的大模型并行方法、装置和电子装置，应用于大模型领域，其中，该方法包括：获取面向集群的大模型在预设微处理批次及预设并行方式下的算子信息，算子信息包括面向集群的大模型中算子的算子时间信息和算子内存信息；集群包括一种或多种类型的加速器；基于算子信息、大模型所需的模型内存信息以及加速器的内存最值，确定大模型中多个流水线的初始算子并行配置策略；根据预设的负载均衡方式，对初始算子并行配置策略进行递归处理，得到目标算子并行配置策略，基于目标算子并行配置策略，运行面向集群的大模型。通过本申请提高了大模型并行配置时芯片计算性能的利用效率，实现了大模型训练的高效性且适用广泛性。

技术关键词

流水线内存集群并行方法均衡方式加速器电子装置负载均衡策略通讯模块处理器可读存储介质存储器计算机节点芯片

系统为您推荐了相关专利信息

一种基于火灾风险防控单元的区域火灾风险评估方法

风险点区域火灾风险建筑手机信令数据集群

一种考虑电网调控需求的灵活性资源可行域聚合方法

多面体资源启发式算法有功功率矩阵

一种风光电源互补汇聚方法

汇聚方法风光矩阵光伏电站出力电源

基于人工智能的网络安全威胁分析数据传输系统及方法

网络安全威胁数据传输系统主机数据传输效能程序

一种基于堆栈技术处理学生学籍异动的方法

堆栈技术学生电子邮件服务对象调用堆栈

一种面向集群的大模型并行方法、装置和电子装置

站点导航

APP 下载