摘要
本发明公开了面向异构集群环境的模型流水线划分及部署方法和系统,涉及到人工智能技术领域,包括:遍历模型工作流,得到当前GPU上模型每一层的执行时间,据以通过算力比例来估算模型每一层在异构GPU上的执行时间;根据GPU总算力将模型切分为执行时间相等的虚拟阶段块,以算力最低的GPU为基准,在其他GPU上按算力比例分别放置虚拟阶段块,得到模型逻辑分割结果;构建GPU之间的网络拓扑图,利用图搜索算法得到全部GPU设备物理映射的排序队列,将GPU根据排序队列中位置进行排序,并将模型逻辑分割结果映射到排序队列的物理节点上;该模型流水线划分及部署方法和系统提高了设备利用率,减少了流水线空闲时间。
技术关键词
面向异构集群
分区
网络拓扑
流水线
搜索算法
拓扑图
队列
工作流
序列
阶段
物理
逻辑
模块
索引
人工智能技术
节点
基准
参数
列表
系统为您推荐了相关专利信息
位移监测方法
地形特征参数
环境监测数据
地质结构
分区
抽水蓄能机组
可调度负荷
出清方法
火电
新能源机组