摘要
本申请属于人工智能芯片加速技术领域,提出了一种专家混合模型执行运算任务的加速方法及相关设备。其中,所述方法包括:获取待处理运算任务,并确定专家混合模型中用于执行待处理运算任务的目标专家网络,专家混合模型中各个第一专家网络的网络参数保存在加速器芯片的片上内存,专家混合模型中各个第二专家网络的网络参数保存在加速器芯片的片外内存;从片上内存中调用目标专家网络中第一专家网络的第一网络参数,以及从片外内存中调用目标专家网络中第二专家网络的第二网络参数;基于第一网络参数和第二网络参数,通过专家混合模型中的目标专家网络执行待处理运算任务。通过本申请提供的技术方案能够提高专家混合模型执行运算任务的加速效率。
技术关键词
网络
加速器
边界扫描测试
内存
参数
矩阵
图形处理芯片
计算机程序产品
人工智能芯片
可读存储介质
建立通信
指令
处理器
加速装置
汉明距离
时分复用
定义