一种基于样本感知的大语言模型自适应结构化剪枝方法和系统

正文

推荐专利

申请号：CN202510305336

申请日期：2025-03-14

公开号：CN120181168A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了一种基于样本感知的大语言模型自适应结构化剪枝方法和系统，旨在通过自适应优化剪枝过程，压缩大语言模型的大小，同时提高其推理效率和性能。本发明通过贝叶斯优化在结构化剪枝解空间中自适应地搜索最佳的校准数据和重要性评估指标，从而避免了传统方法中人工设计和试错的繁琐过程。具体而言，本发明结合了粗粒度和细粒度的权重重要性评估指标，全面评估参数对模型性能的影响，从而准确识别冗余参数，进行结构化剪枝。最终，通过低秩自适应微调技术，恢复因剪枝而损失的性能。本发明能够显著减少模型的存储和计算需求，提高模型的部署效率，适应多种硬件环境，且具有较高的灵活性和可扩展性，广泛适用于大语言模型的实际应用中。

技术关键词

剪枝方法指标校准大语言模型微调技术模型剪枝数据样本矩阵元素模块参数

系统为您推荐了相关专利信息

营业线施工机械进场用跨旅客地道临时爬坡架搭设方法及结构

施工机械搭设方法地形特征旅客支撑节点

语音交互方法、装置及电子设备

客户端设备收音装置数据语音交互方法服务端

音乐生成方法、装置、电子设备及存储介质

音乐生成方法预训练模型语义特征提取美学样本

一种基于大语言模型的医学问答系统

大语言模型问答系统疾病基座医学知识图谱

热转印机生产线加工运行控制方法及系统

热转印机印刷品计算机程序代码速度神经网络模型训练

一种基于样本感知的大语言模型自适应结构化剪枝方法和系统

站点导航

APP 下载