一种车云协同中基于模型压缩和知识蒸馏的DNN推理加速方法

正文

推荐专利

申请号：CN202510234942

申请日期：2025-02-28

公开号：CN120258130A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开一种车云协同中基于模型压缩和知识蒸馏的DNN推理加速方法，包括以下步骤：1)建立车云协同计算系统，包括云端服务器和车载终端设备；2)基于车载终端设备资源限制，在云端服务器上对预训练的DNN模型进行压缩；3)在云端服务器上，对压缩后的DNN模型进行蒸馏；4)以总推理延迟最短为目标，对蒸馏后的DNN模型进行分割，得到第一DNN模型和第二DNN模型，并将第一DNN模型部署在车载终端设备上，将第二DNN模型部署在云端服务器；5)执行DNN推理。本发明综合考虑了不同的车载终端任务对准确率及推理时延的要求，将DNN模型进行压缩并分区部署在车载终端设备和云端服务器上，进一步提高了DNN推理的速度。

技术关键词

车载终端设备云端服务器模型压缩 DNN模型蒸馏网络参数策略因子时延模块通道资源分区批量负担计算机代表算法

系统为您推荐了相关专利信息

衣物处理设备的语音控制方法、装置、设备和存储介质

衣物处理单元语音控制方法生成控制命令音频语音控制装置

车辆紧急解锁引导方法、设备、车辆及程序产品

车辆内部人员多媒体系统破窗系统解锁车载通信系统

基于低比特浮点数与模型训练后量化的模型压缩方法

浮点数配置搜索空间模型压缩方法网络模块通道

融合模型蒸馏的建筑设备轻量化智能听诊系统

智能听诊系统建筑设备设备状态数据特征提取模块蒸馏

基于多层次知识蒸馏的T细胞受体-表位结合特异性预测方法

教师蒸馏双线性多层次序列特征

一种车云协同中基于模型压缩和知识蒸馏的DNN推理加速方法

站点导航

APP 下载