多模型压缩方法、装置、任务处理方法、设备及存储介质

AITNT
正文
推荐专利
多模型压缩方法、装置、任务处理方法、设备及存储介质
申请号:CN202510975682
申请日期:2025-07-15
公开号:CN120952083A
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及模型压缩技术领域,提供一种多模型压缩方法、装置、任务处理方法、设备及存储介质,该多模型压缩方法包括:将多个待压缩模型作为叶子节点,基于权重相似性对各叶子节点进行自底向上的层次化聚类,构建残差量化树;从残差量化树的根节点开始,对残差量化树进行自顶向下的残差量化,得到各叶子节点的量化参数;该量化参数包括对待压缩模型的权重矩阵进行量化压缩得到的叶子节点的量化权重矩阵,以及被分配到叶子节点的目标模型的量化系数;量化权重矩阵被各目标模型共享。通过自底向上的层次化聚类,并在聚类的基础上进行自顶向下的残差量化,可以在不引入较大的精度损失的情况下,实现对多模型的量化压缩,确保模型推理的准确性。
技术关键词
模型压缩方法 节点 矩阵 多模型 参数 非暂态计算机可读存储介质 聚类 对象 处理器 压缩装置 误差 输出特征 索引 存储器 电子设备 文本 模块 标识 阶段
系统为您推荐了相关专利信息
1
一种基于三维重建的金融建筑高精度建模方法
高精度建模方法 金融 网格 三维模型 纹理
2
一种Mini-LED表面缺陷检测方法及相关装置
表面缺陷检测方法 关系建模 数据输入模块 特征选择机制 特征提取模块
3
一种基于深度学习耦合感官质量多模态融合传感器的茶叶等级综合评判的方法
融合传感器 综合评判模型 多模态特征 深度卷积神经网络 样本
4
信号处理方法、模块及控制系统
信号处理方法 科氏流量计 信号处理模块 蝙蝠算法 幅值
5
一种基于多跳检索和推理的复杂声明事实核查方法及系统
语句 核查方法 压缩器 记忆模型 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号