面向异构集群环境的模型流水线划分及部署方法和系统

正文

推荐专利

申请号：CN202510595032

申请日期：2025-05-09

公开号：CN120123103B

公开日期：2025-08-12

类型：发明专利

摘要

本发明公开了面向异构集群环境的模型流水线划分及部署方法和系统，涉及到人工智能技术领域，包括：遍历模型工作流，得到当前GPU上模型每一层的执行时间，据以通过算力比例来估算模型每一层在异构GPU上的执行时间；根据GPU总算力将模型切分为执行时间相等的虚拟阶段块，以算力最低的GPU为基准，在其他GPU上按算力比例分别放置虚拟阶段块，得到模型逻辑分割结果；构建GPU之间的网络拓扑图，利用图搜索算法得到全部GPU设备物理映射的排序队列，将GPU根据排序队列中位置进行排序，并将模型逻辑分割结果映射到排序队列的物理节点上；该模型流水线划分及部署方法和系统提高了设备利用率，减少了流水线空闲时间。

技术关键词

面向异构集群分区网络拓扑流水线搜索算法拓扑图队列工作流序列阶段物理逻辑模块索引人工智能技术节点基准参数列表

系统为您推荐了相关专利信息

一种自适应条件的大语言模型代理调优方法

调优方法基础索引文本矩阵

一种用于电动汽车的智能协同充电站管理系统及方法

充电站管理系统决策指数参数智能充电网络

纳米晶继电器耐压测试装置

纳米晶探杆耐压测试仪齿轴继电器检测技术

一种滑坡体位移监测方法及相关产品

位移监测方法地形特征参数环境监测数据地质结构分区

一种考虑多类型市场主体备用预留的省间现货和省内现货融合出清方法及系统

抽水蓄能机组可调度负荷出清方法火电新能源机组

面向异构集群环境的模型流水线划分及部署方法和系统

站点导航

APP 下载