神经网络稀疏方法、系统、设备及介质

正文

推荐专利

神经网络稀疏方法、系统、设备及介质

申请号：CN202510133297

申请日期：2025-02-06

公开号：CN120068943A

公开日期：2025-05-30

类型：发明专利

摘要

一种神经网络稀疏方法，通过获取每个Transformer层中注意力模块及多层感知模块的输入输出相似度；根据模型目标稀疏度、模块预设配额比例以及每个Transformer层中注意力模块及多层感知模块的输入输出相似度，获取每个Transformer层中注意力模块及多层感知模块的模块目标稀疏度；根据每个Transformer层中注意力模块和多层感知模块的模块目标稀疏度，生成每个Transformer层中注意力模块和多层感知模块的每个权重矩阵的全局裁剪模板；根据相应的全局裁剪模板，对每个Transformer层中注意力模块和多层感知模块的权重矩阵进行权重裁剪和重构。通过一次权重剪枝将大语言模型压缩至高稀疏状态，无需重新训练，也能保持优异的性能，与sparseGPT方法相比，在高稀疏度的基准测试性能的准确度表现更优异。

技术关键词

注意力稀疏方法裁剪模板矩阵输出特征配额稀疏系统电子设备算法模型压缩数据获取模块重构模块误差计算机处理器存储装置

系统为您推荐了相关专利信息

MIMO雷达波形设计与天线阵列排布的联合优化方法及系统

天线阵列联合优化方法雷达波形设计协方差矩阵波束

互联网大数据提取方法、装置、设备及存储介质

互联网大数据主题语义特征分布式爬虫网络

城市监控视角下基于去噪扩散模型的内涝检测方法与装置

时空分布图积水背景噪声干扰上下文特征监控视频图像

一种基于大模型的病灶定位方法

病灶定位方法图像编码器模块大语言模型影像分析技术

基于可学习图补丁的面向跨领域图模型预训练方法和系统

补丁预训练方法令牌节点特征数据

神经网络稀疏方法、系统、设备及介质

站点导航

APP 下载