摘要
本发明涉及模型压缩技术领域,提供一种多模型压缩方法、装置、任务处理方法、设备及存储介质,该多模型压缩方法包括:将多个待压缩模型作为叶子节点,基于权重相似性对各叶子节点进行自底向上的层次化聚类,构建残差量化树;从残差量化树的根节点开始,对残差量化树进行自顶向下的残差量化,得到各叶子节点的量化参数;该量化参数包括对待压缩模型的权重矩阵进行量化压缩得到的叶子节点的量化权重矩阵,以及被分配到叶子节点的目标模型的量化系数;量化权重矩阵被各目标模型共享。通过自底向上的层次化聚类,并在聚类的基础上进行自顶向下的残差量化,可以在不引入较大的精度损失的情况下,实现对多模型的量化压缩,确保模型推理的准确性。
技术关键词
模型压缩方法
节点
矩阵
多模型
参数
非暂态计算机可读存储介质
聚类
对象
处理器
压缩装置
误差
输出特征
索引
存储器
电子设备
文本
模块
标识
阶段
系统为您推荐了相关专利信息
表面缺陷检测方法
关系建模
数据输入模块
特征选择机制
特征提取模块
融合传感器
综合评判模型
多模态特征
深度卷积神经网络
样本
信号处理方法
科氏流量计
信号处理模块
蝙蝠算法
幅值