摘要
一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统,属于大语言模型技术领域,解决现有的MoE剪枝方法无法同时兼顾细粒度剪枝、推理加速和结构分析泛化性的需求,粗粒度专家级剪枝损害模型性能,细粒度压缩缺乏速度提升,且缺乏统一微观分析方法的问题。方法包括:将混合专家模型中的每个专家网络拆分为若干微专家,对若干微专家进行建模,使不同专家网络的微专家之间具有可比性;采用微专家排序算法,根据微专家的能量指标对所有微专家进行排序;采用剪枝算法对排序后的微专家进行处理,选取核心微专家进行保留,其余直接删除。本发明适用于边缘计算、多任务学习等应用场景。
技术关键词
排序算法
微观分析方法
计算机设备
指标
网络
剪枝方法
模型剪枝
可读存储介质
加速系统
大语言模型
核心
存储器
处理器
多任务
模块
解码
线性
矩阵
系统为您推荐了相关专利信息
多模态图像处理
激光雷达数据
可见光图像
无人机
特征匹配算法
直播内容推荐方法
机器自学习
内容项
生成用户
数据
天地一体化网络
深度强化学习
卸载方法
空天地一体化
强化学习模型
相控阵天线
天线单元
波束
粒子群模型
粒子群算法