一种混合专家模型推理方法

正文

推荐专利

一种混合专家模型推理方法

申请号：CN202410826116

申请日期：2024-06-25

公开号：CN118863055A

公开日期：2024-10-29

类型：发明专利

摘要

本发明公开一种混合专家模型推理方法，属于深度学习(machine learning)领域。本发明通过自适应和基于敏感度的专家门控机制，动态调整不同输入和每一层所需激活的专家数量，具有基于敏感度分析的自适应专家选取、自适应专家预取与自适应专家缓存三个核心机制，可以优化混合专家模型推理性能。本发明在保持精度不下降的前提下，平均减少了25％的专家激活数量，显著提高了MoE推理的效率，特别适用于边缘设备等内存受限的环境，具有重要的应用价值和广泛的应用前景。

技术关键词

推理方法队列动态规划算法正确率模块校准机制矩阵内存受限在线数据核心元素序列定义精度

系统为您推荐了相关专利信息

一种语音唤醒方法及相关装置

唤醒词检测多语种语音编码器语音唤醒方法编码特征

一种基于多链路自动切换的Mesh网络稳定性增强方法及系统

链路节点网络控制中心强度

一种基于零信任架构的数据访问方法及相关产品

数据访问方法数据访问装置令牌检索加密数据授予访问权限

一种用于晶圆封装检测的多角度成像方法及系统

晶圆成像方法多角度虚拟现实平台生成三维模型

芯片测试数据的处理方法、装置、计算机设备、可读存储介质和程序产品

芯片测试数据分层可视化展示页面数据处理终端指标

一种混合专家模型推理方法

站点导航

APP 下载