面向多NPU异构平台的神经网络流水分布式推理加速方法

正文

推荐专利

申请号：CN202510658591

申请日期：2025-05-21

公开号：CN120523599A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种面向多NPU异构平台的神经网络流水分布式推理加速方法，包括：根据需要进行分布式推理的神经网络模型中各算子的理论计算时间，将神经网络模型划分为多个子模型；根据多个子模型生成第一拆分策略和第二拆分策略；建立NPU执行时延模型，计算第一拆分策略与第二拆分策略在NPU上执行时的负载；根据负载，从第一拆分策略和第二拆分策略中选择更优的一者作为当前拆分策略，并通过迭代对当前拆分策略进行微调；将得到的最优拆分策略中的各子模型分别部署至各NPU，由主控CPU调度以进行输入图像的流水分布式推理。本发明在多NPU之间形成流水线并行架构，使得各NPU在不同时间单位内对不同输入图像进行推理，实现了多NPU核的并行计算。

技术关键词

异构平台策略神经网络模型时延理论性能测试工具图像通信接口瓶颈流水线数据

系统为您推荐了相关专利信息

一种车联网个性化联邦原型增强学习方法

原型学习方法生成特征特征提取器有向无环图

多源迁移自适应增强网络的预测建模方法

预测建模方法深度迁移学习非线性模型预测值条件生成对抗

一种基于集成学习的信用风险预测方法

信用风险预测方法集成学习策略特征选择数据一致性检查加速决策树

基于电磁声发射信号衰减系数谱的功率器件损伤评估方法及装置

电磁声监测点损伤评估方法曲线信号

一种智能电网调度优化方法及系统

智能电网调度传感器模块开关控制装置中央控制模块数据处理模块

面向多NPU异构平台的神经网络流水分布式推理加速方法

站点导航

APP 下载