摘要
本发明公开了一种稀疏专家混合大模型的免重训练剪枝与重组方法,属于大型模型压缩与优化技术领域。本发明的方法旨在解决现有稀疏专家混合(SMoE)模型因需加载全部专家参数而导致的内存占用过高和部署困难的问题。该方法首先基于路由激活统计识别并剪枝冗余专家;随后,将被剪枝的专家分解为神经元级的功能片段,并依据结构相似性将这些片段重新分配至保留的专家中;最后,通过加权聚类算法在保留专家内部合并原始片段与新分配的片段,以重构出参数更少但表达能力更强的紧凑专家。本发明在神经元级别进行细粒度操作,有效解决了专家间固有的表征冲突与错位问题,显著提升了压缩后模型的性能,为部署大规模SMoE模型提供了可靠的技术支撑。
技术关键词
分段
矩阵
内存
计算机电子设备
校准
线性单元
均值聚类算法
文本
参数
三元组
重组系统
存储计算机程序
数据
模型压缩
计算机程序产品
重构模块
处理器
系统为您推荐了相关专利信息
待测环境
在线监测方法
光强
湿度补偿模型
温湿度
苹果贮藏期
无损检测方法
水果内部品质无损检测
纹理特征
反射率图像
数据传输单元
数据传输方法
纠错码编码
符号
码字
半监督分类方法
胃镜图像
多模态协同
编码器
白光