摘要
本公开提供一种基于混合专家模型的专家网络处理方法,涉及大模型、深度学习、自然语言处理、计算机视觉等人工智能技术领域。基于混合专家模型的专家网络处理方法包括:根据多个专家网络分别处理的目标序列单元token的第一处理数量,从多个专家网络中选取目标专家网络;根据第一处理数量与目标处理数量之间的相减结果,得到对应目标专家网络的第二处理数量;根据第二处理数量从多个候选CPU中选取对应目标专家网络的目标CPU;使用目标GPU处理对应目标处理数量的第一目标token,使用目标CPU处理对应第二处理数量的第二目标token;根据目标GPU输出的处理结果以及目标CPU输出的处理结果,得到目标处理结果。本公开能够提升目标token的处理速度、降低目标token的处理时延。
技术关键词
网络分配
序列
人工智能技术
计算机程序产品
计算机视觉
标识
电子设备
处理器通信
自然语言
指令
参数
可读存储介质
处理单元
存储器
时延
系统为您推荐了相关专利信息
风险管控方法
光伏发电系统
数字孪生技术
神经网络模型
序列
防水灯箱
空气换热
智能控制方法
数据融合算法
动力
轻度认知障碍
注意力
阿尔茨海默
表格特征
混合块