一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统

AITNT
正文
推荐专利
一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统
申请号:CN202511064262
申请日期:2025-07-31
公开号:CN120952174A
公开日期:2025-11-14
类型:发明专利
摘要
一种基于微专家排序的混合专家模型结构化剪枝与加速方法及系统,属于大语言模型技术领域,解决现有的MoE剪枝方法无法同时兼顾细粒度剪枝、推理加速和结构分析泛化性的需求,粗粒度专家级剪枝损害模型性能,细粒度压缩缺乏速度提升,且缺乏统一微观分析方法的问题。方法包括:将混合专家模型中的每个专家网络拆分为若干微专家,对若干微专家进行建模,使不同专家网络的微专家之间具有可比性;采用微专家排序算法,根据微专家的能量指标对所有微专家进行排序;采用剪枝算法对排序后的微专家进行处理,选取核心微专家进行保留,其余直接删除。本发明适用于边缘计算、多任务学习等应用场景。
技术关键词
排序算法 微观分析方法 计算机设备 指标 网络 剪枝方法 模型剪枝 可读存储介质 加速系统 大语言模型 核心 存储器 处理器 多任务 模块 解码 线性 矩阵
系统为您推荐了相关专利信息
1
漏洞信息检索方法、装置、电子设备及存储介质
漏洞 大语言模型 信息检索方法 答案 指令
2
无人机多模态图像处理方法、装置、设备和存储介质
多模态图像处理 激光雷达数据 可见光图像 无人机 特征匹配算法
3
一种基于人工智能的互联网直播内容推荐方法及系统
直播内容推荐方法 机器自学习 内容项 生成用户 数据
4
一种基于分层深度强化学习的空天地一体化网络任务卸载方法
天地一体化网络 深度强化学习 卸载方法 空天地一体化 强化学习模型
5
一种相控阵天线波束展宽优化方法及系统
相控阵天线 天线单元 波束 粒子群模型 粒子群算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号