摘要
本发明公开了一种多加速器异构SoC平台上深度学习负载映射优化方法及系统,涉及计算机性能能耗协同优化技术领域,用以提高深度学习推理应用的性能同时降低能耗。本发明的技术要点包括:首先提取有性能或能耗优化潜力的子网络;接着测量融合节点和子网络的性能和能耗数据;再建立解析的性能和能耗预测模型,以预测不同映射配置下推理引擎的运行时间和能耗;之后使用基于变长滑动窗口的映射优化算法搜索性能‑能耗更优的映射配置;最后生成推理引擎并遍历搜索最优的CUDA stream数量。本发明无需用户干预,可以全自动地找到性能‑能耗更优的映射配置并生成推理引擎。与现有的JEDI等方法相比,本发明性能提升更多,能耗节省也更多,同时优化过程所需时间也更短。
技术关键词
映射优化方法
深度学习模型
网络
加速器
能耗预测模型
节点
生成深度学习
滑动窗口
广度优先搜索算法
深度优先搜索算法
协同优化技术
异构计算平台
入口
数据
动态
系统为您推荐了相关专利信息
案件数据
文书生成方法
文本
TextRank算法
命名实体识别
动态预测方法
采集终端
轮廓系数
动态预测系统
聚类特征
淋浴装置控制方法
消毒液
序列
模式
动态温度控制