一种混合专家模型的压缩及推理方法、电子设备、介质

AITNT
正文
推荐专利
一种混合专家模型的压缩及推理方法、电子设备、介质
申请号:CN202510765691
申请日期:2025-06-09
公开号:CN120806117A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种混合专家模型的压缩及推理方法、电子设备、介质,通过分层预测优化动态专家混合模型的推理效率。核心设计将预测层(含剪枝稀疏后的专家模型)部署于GPU,完整专家模型存于CPU内存。推理过程包括:利用第i‑1层隐状态预测第i层的专家激活分布。将预测激活的专家模型通过PCIe总线从CPU加载至GPU。执行第i层时,若路由网络输出的实际激活专家与预测不符,则动态重载缺失专家至GPU。复用第i层投影矩阵作为专家内稀疏预测模型,基于第i‑1层隐状态预测激活通道索引。该方法通过预加载降低延迟,结合专家级与通道级稀疏化提升计算效率,利用隐状态相似性分析实现分层精准预测,通过动态补救机制保障准确性。
技术关键词
推理方法 矩阵 电子设备 处理器 索引 多层感知机 计算机程序产品 通道 存储器 动态 数据 内存 可读存储介质 网络 分层 元素 指令
系统为您推荐了相关专利信息
1
一种基于图像处理与对抗网络的射线图像数据增强方法
卷积模块 生成器网络 图像处理 射线 矩阵
2
一种车载摄像装置通信系统
车载摄像装置 信号处理器 光发射组件 接收端电路 通信系统
3
基于动态优化的问答大语言模型集群协同问答方法、系统、设备及介质
大语言模型 问答方法 指令 集群 动态
4
基于机器学习模型的联网收费数据异常检测与纠正方法
联网收费数据 纠正方法 机器学习模型 异常数据 字段
5
一种手术导航定位系统、方法、电子设备及存储介质
双目相机 手术导航定位系统 示踪器 坐标系 机械臂
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号