一种混合专家模型推理方法

AITNT
正文
推荐专利
一种混合专家模型推理方法
申请号:CN202410826116
申请日期:2024-06-25
公开号:CN118863055A
公开日期:2024-10-29
类型:发明专利
摘要
本发明公开一种混合专家模型推理方法,属于深度学习(machine learning)领域。本发明通过自适应和基于敏感度的专家门控机制,动态调整不同输入和每一层所需激活的专家数量,具有基于敏感度分析的自适应专家选取、自适应专家预取与自适应专家缓存三个核心机制,可以优化混合专家模型推理性能。本发明在保持精度不下降的前提下,平均减少了25%的专家激活数量,显著提高了MoE推理的效率,特别适用于边缘设备等内存受限的环境,具有重要的应用价值和广泛的应用前景。
技术关键词
推理方法 队列 动态规划算法 正确率 模块 校准 机制 矩阵 内存 受限 在线 数据 核心 元素 序列 定义 精度
系统为您推荐了相关专利信息
1
一种语音唤醒方法及相关装置
唤醒词检测 多语种语音 编码器 语音唤醒方法 编码特征
2
一种基于多链路自动切换的Mesh网络稳定性增强方法及系统
链路 节点 网络 控制中心 强度
3
一种基于零信任架构的数据访问方法及相关产品
数据访问方法 数据访问装置 令牌 检索加密数据 授予访问权限
4
一种用于晶圆封装检测的多角度成像方法及系统
晶圆 成像方法 多角度 虚拟现实平台 生成三维模型
5
芯片测试数据的处理方法、装置、计算机设备、可读存储介质和程序产品
芯片测试数据 分层可视化 展示页面 数据处理终端 指标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号