一种基于样本感知的大语言模型自适应结构化剪枝方法和系统

AITNT
正文
推荐专利
一种基于样本感知的大语言模型自适应结构化剪枝方法和系统
申请号:CN202510305336
申请日期:2025-03-14
公开号:CN120181168A
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种基于样本感知的大语言模型自适应结构化剪枝方法和系统,旨在通过自适应优化剪枝过程,压缩大语言模型的大小,同时提高其推理效率和性能。本发明通过贝叶斯优化在结构化剪枝解空间中自适应地搜索最佳的校准数据和重要性评估指标,从而避免了传统方法中人工设计和试错的繁琐过程。具体而言,本发明结合了粗粒度和细粒度的权重重要性评估指标,全面评估参数对模型性能的影响,从而准确识别冗余参数,进行结构化剪枝。最终,通过低秩自适应微调技术,恢复因剪枝而损失的性能。本发明能够显著减少模型的存储和计算需求,提高模型的部署效率,适应多种硬件环境,且具有较高的灵活性和可扩展性,广泛适用于大语言模型的实际应用中。
技术关键词
剪枝方法 指标 校准 大语言模型 微调技术 模型剪枝 数据 样本 矩阵 元素 模块 参数
系统为您推荐了相关专利信息
1
营业线施工机械进场用跨旅客地道临时爬坡架搭设方法及结构
施工机械 搭设方法 地形特征 旅客 支撑节点
2
语音交互方法、装置及电子设备
客户端设备 收音装置 数据 语音交互方法 服务端
3
音乐生成方法、装置、电子设备及存储介质
音乐生成方法 预训练模型 语义特征提取 美学 样本
4
一种基于大语言模型的医学问答系统
大语言模型 问答系统 疾病 基座 医学知识图谱
5
热转印机生产线加工运行控制方法及系统
热转印机 印刷品 计算机程序代码 速度 神经网络模型训练
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号