一种部署在终端设备系统中的深度学习模型运行方法

正文

推荐专利

申请号：CN202510512564

申请日期：2025-04-23

公开号：CN120671745A

公开日期：2025-09-19

类型：发明专利

摘要

本发明提供一种部署在终端设备系统中的深度学习模型运行方法，该方法包括：S1、对深度学习模型使用类别自适应剪枝方法，以便精确地减小深度学习模型的大小；S2、对深度学习模型使用基于任务聚类的自动模型并行方法，以便优化深度学习模型的并行执行策略；S3、对深度学习模型使用异构多核片的系统多级流水线并行优化方法，以便提高深度学习模型在异构多核片系统上的推理性能和效率。通过本发明的方法，协同处理模型压缩、并行计算和硬件调度的运行，显著提高了部署深度学习模型的智能终端设备在真实场景中的实用性。

技术关键词

深度学习模型终端设备系统并行优化方法流水线并行方法剪枝方法注意力贪心算法预测类别异构智能终端设备拓扑图并行策略模型压缩神经网络模型集群内存图片机制

系统为您推荐了相关专利信息

一种考虑气候变化和人工调蓄的水库群出库流量预测方法

水库多元线性回归模型流量预测方法残差预测入口

无传感器直流无刷电机控制系统及方法

深度学习预测控制执行模块转子机械模型动态

一种径流预测方法、装置及计算机可读存储介质

径流预测方法新安江模型汇流蓄水容量曲线计算机程序指令

一种无毒家用消毒液的生产监测方法、系统及存储介质

无毒家用消毒液性能预测模型参数随机森林模型深度强化学习模型

基于深度学习融合模型的锂离子电池剩余使用寿命预测方法

深度学习融合双向长短期记忆网络锂离子电池注意力机制构建卷积神经网络

一种部署在终端设备系统中的深度学习模型运行方法

站点导航

APP 下载