用于大语言模型的推理工程的方法、装置、设备、介质及程序产品

AITNT
正文
推荐专利
用于大语言模型的推理工程的方法、装置、设备、介质及程序产品
申请号:CN202411969139
申请日期:2024-12-30
公开号:CN119886349A
公开日期:2025-04-25
类型:发明专利
摘要
本公开提供一种用于大语言模型的推理工程的方法、装置、设备、介质及程序产品,涉及人工智能技术领域,所述方法包括:根据参与第一目标任务的矩阵的维度,在预先设置的多个矩阵运算算子中确定要执行第一目标任务的目标矩阵运算算子,所述第一目标任务为大语言模型的推理工程中的一个矩阵运算任务,参与所述第一目标任务的所述矩阵为所述矩阵运算任务要运算的矩阵;利用所述目标矩阵运算算子执行所述第一目标任务,得到第一任务结果,所述第一任务结果用于形成所述推理工程的输出信息。本公开能够根据推理工程的实际运算需求选择合适的矩阵运算算子,以提高相关硬件对大语言模型的推理效率,从而有效利用硬件的推理资源。
技术关键词
矩阵 大语言模型 注意力机制 处理器 可读存储介质 人工智能技术 计算机程序产品 存储器 元素 电子设备 指令 参数 模块 节点 资源
系统为您推荐了相关专利信息
1
基于自适应信号处理的多色磁纳米粒子混叠信号分离方法
皮尔逊相关系数 信号处理 滤波器 磁粒子成像 混合矩阵
2
一种基于可解释性的图像识别模型误识别原因定位方法
概念 语义 样本 像素 定位方法
3
一种基于分块Cholesky分解交叉方向乘子法的状态估计方法
状态估计方法 分块 拉格朗日方程 状态估计模型 矩阵
4
信息输入的方法、装置、设备和存储介质
键盘组件 计算机可执行指令 控件 界面 计算机程序产品
5
一种应用于铝型材中转料框的柔性焊接方法及其系统
区域位置信息 轮廓信息 焊接机器人 料框 铝型材
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号