一种深度神经网络加速推理方法、装置及存储介质

正文

推荐专利

申请号：CN202510073434

申请日期：2025-01-17

公开号：CN119476356B

公开日期：2025-05-16

类型：发明专利

摘要

本申请公开了一种深度神经网络加速推理方法、装置及存储介质。本申请方法包括：对标准数据集进行预处理，使用训练集训练深度神经网络模型；记录每层神经元或连接的权重分布以及L1范数；基于训练过程中记录的权重分布和L1范数，确定神经元或连接的重要性数值；按照预设比例剪除重要性数值低于预设的重要性阈值的神经元或连接，并在每次剪枝后动态调整深度神经网络模型的结构；确定量化位宽以及量化上下限值；对剪枝后的深度神经网络模型，基于量化位宽和量化上下限值，对权重和激活值进行假量化处理基于假量化后的结果，计算任务损失和量化误差损失，并更新全精度权重；使用联合损失函数优化模型参数。

技术关键词

深度神经网络模型联合损失函数量化误差推理方法构建深度神经网络输入输出单元图像处理训练集推理装置数值训练深度神经网络多层感知机浮点数同义词精度可读存储介质动态申请方法数据

系统为您推荐了相关专利信息

一种基于区间化压缩的联邦微调方法、装置及相关产品

分区编码微调方法预训练模型服务端

一种基于等效电路模型综合阻抗量化的电池参数离线快速辨识方法

等效电路模型电池参数辨识辨识方法内阻激励电流数据

一种基于反思机制工作记忆的视觉推理方法

记忆匹配网络视觉推理视觉特征推理方法

基于深度学习的数据分析与可视化图表推荐方法及系统

推荐方法字典数据可视化图表构建深度神经网络机器可读程序

基于激光雷达的工业源VOCs分布分析系统

激光雷达分析系统智能分析模块反演算法数据采集模块

一种深度神经网络加速推理方法、装置及存储介质

站点导航

APP 下载