面向多NPU异构平台的神经网络流水分布式推理加速方法

AITNT
正文
推荐专利
面向多NPU异构平台的神经网络流水分布式推理加速方法
申请号:CN202510658591
申请日期:2025-05-21
公开号:CN120523599A
公开日期:2025-08-22
类型:发明专利
摘要
本发明公开了一种面向多NPU异构平台的神经网络流水分布式推理加速方法,包括:根据需要进行分布式推理的神经网络模型中各算子的理论计算时间,将神经网络模型划分为多个子模型;根据多个子模型生成第一拆分策略和第二拆分策略;建立NPU执行时延模型,计算第一拆分策略与第二拆分策略在NPU上执行时的负载;根据负载,从第一拆分策略和第二拆分策略中选择更优的一者作为当前拆分策略,并通过迭代对当前拆分策略进行微调;将得到的最优拆分策略中的各子模型分别部署至各NPU,由主控CPU调度以进行输入图像的流水分布式推理。本发明在多NPU之间形成流水线并行架构,使得各NPU在不同时间单位内对不同输入图像进行推理,实现了多NPU核的并行计算。
技术关键词
异构平台 策略 神经网络模型 时延 理论 性能测试工具 图像 通信接口 瓶颈 流水线 数据
系统为您推荐了相关专利信息
1
一种车联网个性化联邦原型增强学习方法
原型 学习方法 生成特征 特征提取器 有向无环图
2
多源迁移自适应增强网络的预测建模方法
预测建模方法 深度迁移学习 非线性 模型预测值 条件生成对抗
3
一种基于集成学习的信用风险预测方法
信用风险预测方法 集成学习策略 特征选择 数据一致性检查 加速决策树
4
基于电磁声发射信号衰减系数谱的功率器件损伤评估方法及装置
电磁声 监测点 损伤评估方法 曲线 信号
5
一种智能电网调度优化方法及系统
智能电网调度 传感器模块 开关控制装置 中央控制模块 数据处理模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号