一种多加速器异构SoC平台上深度学习负载映射优化方法及系统

正文

推荐专利

申请号：CN202411615432

申请日期：2024-11-13

公开号：CN119476419B

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种多加速器异构SoC平台上深度学习负载映射优化方法及系统，涉及计算机性能能耗协同优化技术领域，用以提高深度学习推理应用的性能同时降低能耗。本发明的技术要点包括：首先提取有性能或能耗优化潜力的子网络；接着测量融合节点和子网络的性能和能耗数据；再建立解析的性能和能耗预测模型，以预测不同映射配置下推理引擎的运行时间和能耗；之后使用基于变长滑动窗口的映射优化算法搜索性能‑能耗更优的映射配置；最后生成推理引擎并遍历搜索最优的CUDA stream数量。本发明无需用户干预，可以全自动地找到性能‑能耗更优的映射配置并生成推理引擎。与现有的JEDI等方法相比，本发明性能提升更多，能耗节省也更多，同时优化过程所需时间也更短。

技术关键词

映射优化方法深度学习模型网络加速器能耗预测模型节点生成深度学习滑动窗口广度优先搜索算法深度优先搜索算法协同优化技术异构计算平台入口数据动态

系统为您推荐了相关专利信息

一种调解文书生成方法及其系统

案件数据文书生成方法文本 TextRank算法命名实体识别

一种能碳动态预测系统及方法

动态预测方法采集终端轮廓系数动态预测系统聚类特征

用于消毒的淋浴装置控制方法及系统

淋浴装置控制方法消毒液序列模式动态温度控制

一种分层加密的神经网络模型加密方法和系统

层级神经网络模型加密密钥保护方法数据

发动机出口断路器多断口并联开断动静态均流方法及系统

断路器动态模糊控制器电流模糊控制方法

一种多加速器异构SoC平台上深度学习负载映射优化方法及系统

站点导航

APP 下载