模型无损压缩方法、模型解压缩方法及装置

正文

推荐专利

模型无损压缩方法、模型解压缩方法及装置

申请号：CN202410946976

申请日期：2024-07-15

公开号：CN118860285B

公开日期：2025-05-06

类型：发明专利

摘要

本申请实施例公开了一种模型无损压缩方法，涉及人工智能技术领域。方法包括：获取模型所包含一个以上网络层分别对应的参数矩阵；确定一个以上网络层分别对应的参数矩阵的数据分布；利用数据分布确定编码位数，编码位数小于参数矩阵中参数所采用的原始位数；按照编码位数，对一个以上网络层分别对应的参数矩阵分别进行编码，得到各网络层对应的参数矩阵的编码结果；存储压缩后的模型数据，压缩后的模型数据包括各网络层对应的参数矩阵的编码结果以及编码表，编码表包括参数矩阵与编码结果之间的映射关系。本申请通过对模型参数矩阵进行编码，对模型参数进行了无损压缩，节约了模型参数的存储空间和模型的访存开销。

技术关键词

编码矩阵参数数据分布无损压缩方法分块解压缩方法查询高速缓存无损压缩装置解压缩装置数据分析单元存储程序指令数据存储单元数据获取单元数值人工智能技术处理器解码单元

模型无损压缩方法、模型解压缩方法及装置

站点导航

APP 下载