摘要
本申请实施例公开了一种模型无损压缩方法,涉及人工智能技术领域。方法包括:获取模型所包含一个以上网络层分别对应的参数矩阵;确定一个以上网络层分别对应的参数矩阵的数据分布;利用数据分布确定编码位数,编码位数小于参数矩阵中参数所采用的原始位数;按照编码位数,对一个以上网络层分别对应的参数矩阵分别进行编码,得到各网络层对应的参数矩阵的编码结果;存储压缩后的模型数据,压缩后的模型数据包括各网络层对应的参数矩阵的编码结果以及编码表,编码表包括参数矩阵与编码结果之间的映射关系。本申请通过对模型参数矩阵进行编码,对模型参数进行了无损压缩,节约了模型参数的存储空间和模型的访存开销。
技术关键词
编码
矩阵
参数
数据分布
无损压缩方法
分块
解压缩方法
查询高速缓存
无损压缩装置
解压缩装置
数据分析单元
存储程序指令
数据存储单元
数据获取单元
数值
人工智能技术
处理器
解码单元