一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统

正文

推荐专利

申请号：CN202511064262

申请日期：2025-07-31

公开号：CN120952174A

公开日期：2025-11-14

类型：发明专利

摘要

一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统，属于大语言模型技术领域，解决现有的MoE剪枝方法无法同时兼顾细粒度剪枝、推理加速和结构分析泛化性的需求，粗粒度专家级剪枝损害模型性能，细粒度压缩缺乏速度提升，且缺乏统一微观分析方法的问题。方法包括：将混合专家模型中的每个专家网络拆分为若干微专家，对若干微专家进行建模，使不同专家网络的微专家之间具有可比性；采用微专家排序算法，根据微专家的能量指标对所有微专家进行排序；采用剪枝算法对排序后的微专家进行处理，选取核心微专家进行保留，其余直接删除。本发明适用于边缘计算、多任务学习等应用场景。

技术关键词

排序算法微观分析方法计算机设备指标网络剪枝方法模型剪枝可读存储介质加速系统大语言模型核心存储器处理器多任务模块解码线性矩阵

系统为您推荐了相关专利信息

自动化物流纸箱变形检测剔除系统

检测器件检测剔除系统压力检测设备物流纸箱压力检测单元

一种基于红外温度补偿混合模型的辊道窑温度的校正方法

校正方法硅碳棒测温对象匣钵数据驱动模型

一种基于聚类分析的网络舆情数据监测处理方法

网络舆情数据语义特征关键词网络特征标签

一种基于DETR的印制电路板缺陷检测方法及装置

印制电路板缺陷多尺度特征跨尺度特征融合回归技术序列

一种洪涝灾害脆弱性曲线模型构建方法

模型构建方法 Logistic函数参数优化模型密度计算方法低空间分辨率

一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统

站点导航

APP 下载