一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统

AITNT
正文
推荐专利
一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统
申请号:CN202511064262
申请日期:2025-07-31
公开号:CN120952174A
公开日期:2025-11-14
类型:发明专利
摘要
一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统,属于大语言模型技术领域,解决现有的MoE剪枝方法无法同时兼顾细粒度剪枝、推理加速和结构分析泛化性的需求,粗粒度专家级剪枝损害模型性能,细粒度压缩缺乏速度提升,且缺乏统一微观分析方法的问题。方法包括:将混合专家模型中的每个专家网络拆分为若干微专家,对若干微专家进行建模,使不同专家网络的微专家之间具有可比性;采用微专家排序算法,根据微专家的能量指标对所有微专家进行排序;采用剪枝算法对排序后的微专家进行处理,选取核心微专家进行保留,其余直接删除。本发明适用于边缘计算、多任务学习等应用场景。
技术关键词
排序算法 微观分析方法 计算机设备 指标 网络 剪枝方法 模型剪枝 可读存储介质 加速系统 大语言模型 核心 存储器 处理器 多任务 模块 解码 线性 矩阵
系统为您推荐了相关专利信息
1
自动化物流纸箱变形检测剔除系统
检测器件 检测剔除系统 压力检测设备 物流纸箱 压力检测单元
2
一种基于红外温度补偿混合模型的辊道窑温度的校正方法
校正方法 硅碳棒 测温对象 匣钵 数据驱动模型
3
一种基于聚类分析的网络舆情数据监测处理方法
网络舆情数据 语义特征 关键词 网络特征 标签
4
一种基于DETR的印制电路板缺陷检测方法及装置
印制电路板缺陷 多尺度特征 跨尺度特征融合 回归技术 序列
5
一种洪涝灾害脆弱性曲线模型构建方法
模型构建方法 Logistic函数 参数优化模型 密度计算方法 低空间分辨率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号