模型拆分方法、装置、设备、介质及计算机程序产品

AITNT
正文
推荐专利
模型拆分方法、装置、设备、介质及计算机程序产品
申请号:CN202411036933
申请日期:2024-07-30
公开号:CN118821972A
公开日期:2024-10-22
类型:发明专利
摘要
本发明实施例提供了一种模型拆分方法、装置、通信设备及存储介质,应用于芯片推理技术领域,包括:在检测到初始计算加速卡对应的显存无法支持初始模型运行的情况下,针对第一计算算子将初始模型拆分为目标剖分结果集合;根据预设时间均衡规则和预设空间均衡规则将目标剖分结果集合进行合并调整,得到目标算子块集合;根据预设动态规划算法确定每个流水线段上运行的目标算子块集合中的目标算子块,并对每个流水线段分配对应的目标计算加速卡,以使初始模型通过流水线段按照流水线并行方式运行在目标计算加速卡。本发明实施例中通过将初始模型拆分为多个子模型进行流水线并行在多个计算加速卡上,避免了模型手动拆分时耗时费力易出错等问题。
技术关键词
加速卡 流水线 动态规划算法 拆分方法 计算机程序产品 节点 列表 通信设备 推理技术 处理器 拆分装置 内存 关系 存储器 收发机 可读存储介质 模块 指令 数值
系统为您推荐了相关专利信息
1
用于解释由工业自动化系统的机器学习模型引发的警报的系统和方法
工业自动化系统 机器学习模型 警报 解释技术 操作者
2
数据处理方法及装置、芯片、设备和介质
流水 数据处理单元 数据处理装置执行 数据处理方法 信号
3
基于大语言模型的工程建设电子文档归档方法及系统
归档方法 大语言模型 工程建设项目 工程建设管理 目录
4
视频生成方法、视频生成模型的训练方法及装置
视频生成模型 噪声数据 分辨率 噪声样本 注意力
5
基于时空注意力机制的数控加工动态误差补偿方法及系统
动态误差补偿方法 时空注意力机制 振动传感器 红外热像仪 机床动力学特性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号