摘要
一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统,属于大语言模型技术领域,解决现有的MoE剪枝方法无法同时兼顾细粒度剪枝、推理加速和结构分析泛化性的需求,粗粒度专家级剪枝损害模型性能,细粒度压缩缺乏速度提升,且缺乏统一微观分析方法的问题。方法包括:将混合专家模型中的每个专家网络拆分为若干微专家,对若干微专家进行建模,使不同专家网络的微专家之间具有可比性;采用微专家排序算法,根据微专家的能量指标对所有微专家进行排序;采用剪枝算法对排序后的微专家进行处理,选取核心微专家进行保留,其余直接删除。本发明适用于边缘计算、多任务学习等应用场景。
技术关键词
排序算法
微观分析方法
计算机设备
指标
网络
剪枝方法
模型剪枝
可读存储介质
加速系统
大语言模型
核心
存储器
处理器
多任务
模块
解码
线性
矩阵
系统为您推荐了相关专利信息
检测器件
检测剔除系统
压力检测设备
物流纸箱
压力检测单元
印制电路板缺陷
多尺度特征
跨尺度特征融合
回归技术
序列
模型构建方法
Logistic函数
参数优化模型
密度计算方法
低空间分辨率