摘要
本申请提供一种基于混合专家的模型推理方法和装置,涉及人工智能技术领域,包括:将特征向量输入注意力混合专家模块,由所述注意力混合专家模块将所述特征向量分解为多个特征子向量,并基于各个特征子向量确定对应的查询向量投影矩阵进行注意力计算,得到各个注意力头输出的第一向量;将所述第一向量输入神经网络混合专家模块,得到各个神经网络输出的第二向量;基于所述第二向量,确定所述特征向量对应的模型推理结果。本申请提供的方法和装置,充分利用了输入的特征向量中的信息和各个专家中的信息,提高了大模型的推理效果。
技术关键词
推理方法
注意力
前馈神经网络
非暂态计算机可读存储介质
模块
推理装置
处理器
矩阵
人工智能技术
计算机程序产品
存储器
电子设备
尺寸
系统为您推荐了相关专利信息
遗传算法
多模块并联
启发式信息
蚁群算法
定位方法
工业互联网平台
因子
数据处理模块
协议转换模块
数据采集系统
状态检测方法
带式输送机
预测网络模型
皮带输送机
神经网络训练
电力需求预测
子模块
混合整数线性规划
煤炭
时序预测模型
电子显示屏
真空吸附平台
压力采集模块
真空腔体
真空泵