模型压缩方法以及相关装置

AITNT
正文
推荐专利
模型压缩方法以及相关装置
申请号:CN202411095569
申请日期:2024-08-12
公开号:CN118673994B
公开日期:2025-01-24
类型:发明专利
摘要
本发明实施例提供一种模型压缩方法以及相关装置,属于人工智能技术领域。该方法包括:利用训练数据进行模型训练获得第一深度学习模型,并获得第一深度学习模型的自注意力层对应的第一重要性评分;根据第一重要性评分对第一深度学习模型的自注意力层进行剪枝,获得第二深度学习模型;利用训练数据对第二深度学习模型进行重新训练,获得第三深度学习模型,并获得第三深度学习模型中的自注意力层对应的第二重要性评分;根据第二重要性评分对第三深度学习模型进行精度量化获得第四深度学习模型;利用第一深度学习模型对第四深度学习模型进行蒸馏处理,获得目标深度学习模型。通过逐层自适应量化和混合精度计算策略,提高计算效率,加速模型推理过程。
技术关键词
深度学习模型 注意力 模型压缩方法 学生 深度学习框架 精度 蒸馏 教师 矩阵 幅值 计算机存储介质 前馈神经网络 参数 数据 终端设备 存储计算机程序 人工智能技术 模块 处理器
系统为您推荐了相关专利信息
1
一种多模态元数据检索增强生成方法及系统
多模态特征融合 生成方法 数据 大语言模型 复杂度
2
一种空管系统网络威胁实体识别方法及系统
空管系统 实体识别方法 实体识别模型 网络 文本
3
设备维护策略的确定方法、装置、设备、介质及产品
链路预测模型 三元组 图谱 节点 策略
4
一种基于人工智能与大数据的网络安全风险预测方法
网络安全风险 网络数据预测 卷积神经网络模型 网络流量数据 层次分析法
5
基于多源数据融合的智能采砂监管系统
并行神经网络 监管系统 声学振动传感器 分布式光纤振动传感 浊度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号