摘要
本发明公开了一种动态路由混合专家模型的推理方法、系统、设备及介质,它们是相对应的方案,方案中:通过自动化的并行策略搜索,本发明能将模型切分为运行时间均衡的流水线阶段,减少计算单元的空闲率,进而有效地提升计算单元的执行效率;并且,本发明的自动化搜索过程通过细粒度的并行策略划分,能够在满足内存限制的情况下尽可能降低最大的流水线阶段运行时间,从而提高模型的推理性能。
技术关键词
并行策略
流水线
阶段
推理方法
模块
内存
动态
变换器
注意力
节点
符号
推理系统
序列
处理器
分析工具
定义
框架
可读存储介质
数据
系统为您推荐了相关专利信息
电子标签数据
解密
加密算法
数据获取模块
标志位
主题
菜单管理
排序算法
应用程序编程接口
HSL空间
智能文档
自然语言文本
预训练语言模型
生成系统
计算机视觉检测
波阻抗反演方法
初始波阻抗
岩性模型
分布特征
反演模型