稀疏专家混合大模型的免重训练剪枝与重组方法及系统

AITNT
正文
推荐专利
稀疏专家混合大模型的免重训练剪枝与重组方法及系统
申请号:CN202511098153
申请日期:2025-08-06
公开号:CN120996126A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种稀疏专家混合大模型的免重训练剪枝与重组方法,属于大型模型压缩与优化技术领域。本发明的方法旨在解决现有稀疏专家混合(SMoE)模型因需加载全部专家参数而导致的内存占用过高和部署困难的问题。该方法首先基于路由激活统计识别并剪枝冗余专家;随后,将被剪枝的专家分解为神经元级的功能片段,并依据结构相似性将这些片段重新分配至保留的专家中;最后,通过加权聚类算法在保留专家内部合并原始片段与新分配的片段,以重构出参数更少但表达能力更强的紧凑专家。本发明在神经元级别进行细粒度操作,有效解决了专家间固有的表征冲突与错位问题,显著提升了压缩后模型的性能,为部署大规模SMoE模型提供了可靠的技术支撑。
技术关键词
分段 矩阵 内存 计算机电子设备 校准 线性单元 均值聚类算法 文本 参数 三元组 重组系统 存储计算机程序 数据 模型压缩 计算机程序产品 重构模块 处理器
系统为您推荐了相关专利信息
1
一种油烟在线监测方法、系统、计算设备及介质
待测环境 在线监测方法 光强 湿度补偿模型 温湿度
2
基于分段波峰与自适应阈值调整的条码识别方法、系统及介质
条码图像 条码识别方法 波形 数据 分段
3
一种苹果贮藏期苦痘病的无损检测方法及其在早期鉴定苹果苦痘病的应用
苹果贮藏期 无损检测方法 水果内部品质无损检测 纹理特征 反射率图像
4
一种数据传输方法、系统、设备、介质及计算机程序产品
数据传输单元 数据传输方法 纠错码编码 符号 码字
5
一种多模态协同学习的胃镜图像半监督分类方法
半监督分类方法 胃镜图像 多模态协同 编码器 白光
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号