摘要
本发明提供一种部署在终端设备系统中的深度学习模型运行方法,该方法包括:S1、对深度学习模型使用类别自适应剪枝方法,以便精确地减小深度学习模型的大小;S2、对深度学习模型使用基于任务聚类的自动模型并行方法,以便优化深度学习模型的并行执行策略;S3、对深度学习模型使用异构多核片的系统多级流水线并行优化方法,以便提高深度学习模型在异构多核片系统上的推理性能和效率。通过本发明的方法,协同处理模型压缩、并行计算和硬件调度的运行,显著提高了部署深度学习模型的智能终端设备在真实场景中的实用性。
技术关键词
深度学习模型
终端设备系统
并行优化方法
流水线
并行方法
剪枝方法
注意力
贪心算法
预测类别
异构
智能终端设备
拓扑图
并行策略
模型压缩
神经网络模型
集群
内存
图片
机制
系统为您推荐了相关专利信息
水库
多元线性回归模型
流量预测方法
残差预测
入口
径流预测方法
新安江模型
汇流
蓄水容量曲线
计算机程序指令
无毒家用消毒液
性能预测模型
参数
随机森林模型
深度强化学习模型
深度学习融合
双向长短期记忆网络
锂离子电池
注意力机制
构建卷积神经网络