一种深度神经网络加速推理方法、装置及存储介质

AITNT
正文
推荐专利
一种深度神经网络加速推理方法、装置及存储介质
申请号:CN202510073434
申请日期:2025-01-17
公开号:CN119476356B
公开日期:2025-05-16
类型:发明专利
摘要
本申请公开了一种深度神经网络加速推理方法、装置及存储介质。本申请方法包括:对标准数据集进行预处理,使用训练集训练深度神经网络模型;记录每层神经元或连接的权重分布以及L1范数;基于训练过程中记录的权重分布和L1范数,确定神经元或连接的重要性数值;按照预设比例剪除重要性数值低于预设的重要性阈值的神经元或连接,并在每次剪枝后动态调整深度神经网络模型的结构;确定量化位宽以及量化上下限值;对剪枝后的深度神经网络模型,基于量化位宽和量化上下限值,对权重和激活值进行假量化处理基于假量化后的结果,计算任务损失和量化误差损失,并更新全精度权重;使用联合损失函数优化模型参数。
技术关键词
深度神经网络模型 联合损失函数 量化误差 推理方法 构建深度神经网络 输入输出单元 图像处理 训练集 推理装置 数值 训练深度神经网络 多层感知机 浮点数 同义词 精度 可读存储介质 动态 申请方法 数据
系统为您推荐了相关专利信息
1
一种基于区间化压缩的联邦微调方法、装置及相关产品
分区 编码 微调方法 预训练模型 服务端
2
一种基于等效电路模型综合阻抗量化的电池参数离线快速辨识方法
等效电路模型 电池参数辨识 辨识方法 内阻 激励电流数据
3
一种基于反思机制工作记忆的视觉推理方法
记忆 匹配网络 视觉推理 视觉特征 推理方法
4
基于深度学习的数据分析与可视化图表推荐方法及系统
推荐方法 字典 数据可视化图表 构建深度神经网络 机器可读程序
5
基于激光雷达的工业源VOCs分布分析系统
激光雷达 分析系统 智能分析模块 反演算法 数据采集模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号