模型压缩方法以及相关装置

正文

推荐专利

模型压缩方法以及相关装置

申请号：CN202411095569

申请日期：2024-08-12

公开号：CN118673994B

公开日期：2025-01-24

类型：发明专利

摘要

本发明实施例提供一种模型压缩方法以及相关装置，属于人工智能技术领域。该方法包括：利用训练数据进行模型训练获得第一深度学习模型，并获得第一深度学习模型的自注意力层对应的第一重要性评分；根据第一重要性评分对第一深度学习模型的自注意力层进行剪枝，获得第二深度学习模型；利用训练数据对第二深度学习模型进行重新训练，获得第三深度学习模型，并获得第三深度学习模型中的自注意力层对应的第二重要性评分；根据第二重要性评分对第三深度学习模型进行精度量化获得第四深度学习模型；利用第一深度学习模型对第四深度学习模型进行蒸馏处理，获得目标深度学习模型。通过逐层自适应量化和混合精度计算策略，提高计算效率，加速模型推理过程。

技术关键词

深度学习模型注意力模型压缩方法学生深度学习框架精度蒸馏教师矩阵幅值计算机存储介质前馈神经网络参数数据终端设备存储计算机程序人工智能技术模块处理器

系统为您推荐了相关专利信息

一种多模态元数据检索增强生成方法及系统

多模态特征融合生成方法数据大语言模型复杂度

一种空管系统网络威胁实体识别方法及系统

空管系统实体识别方法实体识别模型网络文本

设备维护策略的确定方法、装置、设备、介质及产品

链路预测模型三元组图谱节点策略

一种基于人工智能与大数据的网络安全风险预测方法

网络安全风险网络数据预测卷积神经网络模型网络流量数据层次分析法

基于多源数据融合的智能采砂监管系统

并行神经网络监管系统声学振动传感器分布式光纤振动传感浊度

模型压缩方法以及相关装置

站点导航

APP 下载