摘要
本申请公开了一种模型压缩方法及装置,涉及模型压缩技术领域,模型压缩方法包括:以减少参数数量为目标,对目标模型每层的每个权重矩阵进行压缩,得到目标模型每层的每个权重矩阵的第一压缩权重矩阵;针对每个第一压缩权重矩阵,对第一压缩权重矩阵在通道维度进行分组,得到若干通道组;从每个通道组中筛选目标通道,任一通道组中目标通道的通道能量高于该通道组中非目标通道的通道能量;通过对第一压缩权重矩阵中的目标通道进行旋转操作来平滑第一压缩权重矩阵的分布,得到第二压缩权重矩阵;采用分段量化策略对第二压缩权重矩阵进行量化。本申请公开的模型压缩方法能够有效减少目标模型的参数量,且能够降低存储占用、提升计算效率。
技术关键词
模型压缩方法
矩阵
通道
聚类
高斯混合模型
策略
模块
元素
参数
分段
指标
索引
系统为您推荐了相关专利信息
数据预测模型
数据分类分级
k均值聚类算法
正则化技术
超参数
切换系统
切换器
控制器
系统状态信息
安全控制方法
动态预测模型
情感反馈
关键意见领袖
分布式计算框架
预警机制