大语言模型的剪枝方法、装置、存储介质及计算机设备

AITNT
正文
推荐专利
大语言模型的剪枝方法、装置、存储介质及计算机设备
申请号:CN202411727166
申请日期:2024-11-27
公开号:CN119647623A
公开日期:2025-03-18
类型:发明专利
摘要
本申请涉及大模型和金融科技技术领域,公开了一种大语言模型的剪枝方法、装置、存储介质及计算机设备,该方法包括:获取待剪枝的大语言模型,确定所述大语言模型中的冗余层;提取所述冗余层的权重矩阵,并对所述权重矩阵进行奇异值分解,确定所述权重矩阵对应的多个奇异值;基于所述大语言模型对应的辅助校准数据集,计算每个奇异值对下游任务的性能影响,根据每个奇异值的性能影响确定多个奇异值中待保留的目标奇异值;根据所述目标奇异值对所述权重矩阵进行低秩分解,并将所述权重矩阵替换为低秩分解得到的低秩矩阵。实现了对大语言模型的剪枝补偿,在减少大语言模型的参数量的同时,保证了大语言模型的性能。
技术关键词
大语言模型 矩阵 冗余 剪枝方法 计算机设备 校准 金融科技技术 数据 剪枝装置 处理器 模块
系统为您推荐了相关专利信息
1
一种任务智能分配方法和相关设备
智能分配方法 自然语言文本 智能体系统 执行设备 智能分配装置
2
基于特征融合和位姿反馈的运动想象脑机接口控制系统及方法
运动想象脑机接口 运动执行机构 脑电信号采集模块 脑电信号处理 控制器系统
3
基于LWE的密文域可直读无损信息隐藏方法及系统
无损信息隐藏方法 明文 图像 冗余 信息隐藏系统
4
内容表征的应用处理方法、计算机设备、可读存储介质和程序产品
内容分类 样本 数据 计算机设备 计算机程序产品
5
发票处理方法、装置、计算机设备及存储介质
发票 数据存储 计算机可读指令 数据查询请求 存储表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号