摘要
本发明实施例提供了一种模型拆分方法、装置、通信设备及存储介质,应用于芯片推理技术领域,包括:在检测到初始计算加速卡对应的显存无法支持初始模型运行的情况下,针对第一计算算子将初始模型拆分为目标剖分结果集合;根据预设时间均衡规则和预设空间均衡规则将目标剖分结果集合进行合并调整,得到目标算子块集合;根据预设动态规划算法确定每个流水线段上运行的目标算子块集合中的目标算子块,并对每个流水线段分配对应的目标计算加速卡,以使初始模型通过流水线段按照流水线并行方式运行在目标计算加速卡。本发明实施例中通过将初始模型拆分为多个子模型进行流水线并行在多个计算加速卡上,避免了模型手动拆分时耗时费力易出错等问题。
技术关键词
加速卡
流水线
动态规划算法
拆分方法
计算机程序产品
节点
列表
通信设备
推理技术
处理器
拆分装置
内存
关系
存储器
收发机
可读存储介质
模块
指令
数值
系统为您推荐了相关专利信息
工业自动化系统
机器学习模型
警报
解释技术
操作者
流水
数据处理单元
数据处理装置执行
数据处理方法
信号
归档方法
大语言模型
工程建设项目
工程建设管理
目录
动态误差补偿方法
时空注意力机制
振动传感器
红外热像仪
机床动力学特性