面向异构集群环境的模型流水线划分及部署方法和系统

AITNT
正文
推荐专利
面向异构集群环境的模型流水线划分及部署方法和系统
申请号:CN202510595032
申请日期:2025-05-09
公开号:CN120123103B
公开日期:2025-08-12
类型:发明专利
摘要
本发明公开了面向异构集群环境的模型流水线划分及部署方法和系统,涉及到人工智能技术领域,包括:遍历模型工作流,得到当前GPU上模型每一层的执行时间,据以通过算力比例来估算模型每一层在异构GPU上的执行时间;根据GPU总算力将模型切分为执行时间相等的虚拟阶段块,以算力最低的GPU为基准,在其他GPU上按算力比例分别放置虚拟阶段块,得到模型逻辑分割结果;构建GPU之间的网络拓扑图,利用图搜索算法得到全部GPU设备物理映射的排序队列,将GPU根据排序队列中位置进行排序,并将模型逻辑分割结果映射到排序队列的物理节点上;该模型流水线划分及部署方法和系统提高了设备利用率,减少了流水线空闲时间。
技术关键词
面向异构集群 分区 网络拓扑 流水线 搜索算法 拓扑图 队列 工作流 序列 阶段 物理 逻辑 模块 索引 人工智能技术 节点 基准 参数 列表
系统为您推荐了相关专利信息
1
一种自适应条件的大语言模型代理调优方法
调优方法 基础 索引 文本 矩阵
2
一种用于电动汽车的智能协同充电站管理系统及方法
充电站管理系统 决策 指数 参数 智能充电网络
3
纳米晶继电器耐压测试装置
纳米晶 探杆 耐压测试仪 齿轴 继电器检测技术
4
一种滑坡体位移监测方法及相关产品
位移监测方法 地形特征参数 环境监测数据 地质结构 分区
5
一种考虑多类型市场主体备用预留的省间现货和省内现货融合出清方法及系统
抽水蓄能机组 可调度负荷 出清方法 火电 新能源机组
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号