一种模型压缩方法及装置

AITNT
正文
推荐专利
一种模型压缩方法及装置
申请号:CN202511014255
申请日期:2025-07-21
公开号:CN121010012A
公开日期:2025-11-25
类型:发明专利
摘要
本申请公开了一种模型压缩方法及装置,涉及模型压缩技术领域,模型压缩方法包括:以减少参数数量为目标,对目标模型每层的每个权重矩阵进行压缩,得到目标模型每层的每个权重矩阵的第一压缩权重矩阵;针对每个第一压缩权重矩阵,对第一压缩权重矩阵在通道维度进行分组,得到若干通道组;从每个通道组中筛选目标通道,任一通道组中目标通道的通道能量高于该通道组中非目标通道的通道能量;通过对第一压缩权重矩阵中的目标通道进行旋转操作来平滑第一压缩权重矩阵的分布,得到第二压缩权重矩阵;采用分段量化策略对第二压缩权重矩阵进行量化。本申请公开的模型压缩方法能够有效减少目标模型的参数量,且能够降低存储占用、提升计算效率。
技术关键词
模型压缩方法 矩阵 通道 聚类 高斯混合模型 策略 模块 元素 参数 分段 指标 索引
系统为您推荐了相关专利信息
1
一种基于人工智能的数据分类分级方法
数据预测模型 数据分类分级 k均值聚类算法 正则化技术 超参数
2
一种监测芯片温度的方法
感温电路 电源管理芯片 三极管 电阻 监测点
3
基于两级多防御者斯塔克博格博弈的切换系统安全控制方法
切换系统 切换器 控制器 系统状态信息 安全控制方法
4
一种面向模态缺失场景的动态解耦提示生成与调优方法
文本 动态 视觉 多模态 融合策略
5
一种管理数据处理方法及系统
动态预测模型 情感反馈 关键意见领袖 分布式计算框架 预警机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号