摘要
本公开提供一种用于大语言模型的推理工程的方法、装置、设备、介质及程序产品,涉及人工智能技术领域,所述方法包括:根据参与第一目标任务的矩阵的维度,在预先设置的多个矩阵运算算子中确定要执行第一目标任务的目标矩阵运算算子,所述第一目标任务为大语言模型的推理工程中的一个矩阵运算任务,参与所述第一目标任务的所述矩阵为所述矩阵运算任务要运算的矩阵;利用所述目标矩阵运算算子执行所述第一目标任务,得到第一任务结果,所述第一任务结果用于形成所述推理工程的输出信息。本公开能够根据推理工程的实际运算需求选择合适的矩阵运算算子,以提高相关硬件对大语言模型的推理效率,从而有效利用硬件的推理资源。
技术关键词
矩阵
大语言模型
注意力机制
处理器
可读存储介质
人工智能技术
计算机程序产品
存储器
元素
电子设备
指令
参数
模块
节点
资源
系统为您推荐了相关专利信息
皮尔逊相关系数
信号处理
滤波器
磁粒子成像
混合矩阵
状态估计方法
分块
拉格朗日方程
状态估计模型
矩阵
键盘组件
计算机可执行指令
控件
界面
计算机程序产品