基于混合专家的模型推理方法和装置

AITNT
正文
推荐专利
基于混合专家的模型推理方法和装置
申请号:CN202410775207
申请日期:2024-06-14
公开号:CN118657218A
公开日期:2024-09-17
类型:发明专利
摘要
本申请提供一种基于混合专家的模型推理方法和装置,涉及人工智能技术领域,包括:将特征向量输入注意力混合专家模块,由所述注意力混合专家模块将所述特征向量分解为多个特征子向量,并基于各个特征子向量确定对应的查询向量投影矩阵进行注意力计算,得到各个注意力头输出的第一向量;将所述第一向量输入神经网络混合专家模块,得到各个神经网络输出的第二向量;基于所述第二向量,确定所述特征向量对应的模型推理结果。本申请提供的方法和装置,充分利用了输入的特征向量中的信息和各个专家中的信息,提高了大模型的推理效果。
技术关键词
推理方法 注意力 前馈神经网络 非暂态计算机可读存储介质 模块 推理装置 处理器 矩阵 人工智能技术 计算机程序产品 存储器 电子设备 尺寸
系统为您推荐了相关专利信息
1
一种电源多模块并联系统的故障诊断及定位方法
遗传算法 多模块并联 启发式信息 蚁群算法 定位方法
2
基于工业物联网的数据采集方法、系统及存储介质
工业互联网平台 因子 数据处理模块 协议转换模块 数据采集系统
3
基于光流估计的井下带式输送机运行状态检测方法及系统
状态检测方法 带式输送机 预测网络模型 皮带输送机 神经网络训练
4
一种基于大数据分析的电力需求预测与煤炭供应优化系统
电力需求预测 子模块 混合整数线性规划 煤炭 时序预测模型
5
一种OLED电子显示屏生产输送装置
电子显示屏 真空吸附平台 压力采集模块 真空腔体 真空泵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号