摘要
本申请涉及人工智能硬件加速技术领域,涉及一种基于异构系统的DNN通用部署方法及系统。所述方法包括:将待部署的深度神经网络进行细粒度拆分,划分为多个子层;基于异构系统的硬件参数,将所述子层映射到异构系统的计算核心上,进行初步映射分配;对所述异构系统的通信链路进行建模,形成初步分配方案,估算每条通信链路的延迟和功耗;实时监控数据传输过程中的通信延迟和功耗,并通过数学规划优化算法对分配方案进行离线迭代优化,生成最终优化分配方案;基于所述最终优化分配方案,控制异构系统的计算核心执行子层计算任务,并管理存储模块的张量生命周期。本发明能够更好地适应不同的应用需求,大大提高了系统的自主性和运行效率。
技术关键词
异构系统
数据依赖关系
通信链路
核心
功耗
深度神经网络
存储模块
人工智能硬件加速
变量
规划
哈希查找表
存储管理器
离线
数学
信号
动态更新
能量消耗
板块
系统为您推荐了相关专利信息
数字孪生模型
电力设备
评价指标体系
生成关键词
文本
服务组件
稳定性测试方法
核心板
依赖图模型
自动化测试平台
人工智能处理器
训练特征
平台控制器
通信特征
高频通信链路