推理方法、系统、计算机设备及存储介质

正文

推荐专利

推理方法、系统、计算机设备及存储介质

申请号：CN202411368534

申请日期：2024-09-29

公开号：CN119378681B

公开日期：2025-10-10

类型：发明专利

摘要

本申请公开一种推理方法、系统、计算机设备及存储介质。所述方法应用于包括中央处理单元CPU、图形处理单元GPU和现场可编程门阵列FPGA的目标系统，包括以下步骤：响应于目标推理服务的请求，CPU将目标推理服务的目标输入传到GPU；GPU基于大语言模型的网络结构和权重参数对目标输入进行预填充阶段的计算，得到包括预填充阶段的中间计算结果和最终计算结果的第一数据，并将其传到CPU；CPU将第一数据传到FPGA；FPGA基于大语言模型的网络结构、权重参数和第一数据进行解码阶段的计算，得到第二数据将其传到CPU；CPU将第二数据作为目标推理服务的输出。本申请能够将目标推理服务分阶段部署到GPU和FPGA，通过协作运行的方式完成目标推理服务，充分利用GPU和FPGA的硬件资源。

技术关键词

推理方法大语言模型网络结构现场可编程门阵列解码器图形处理单元数据样本计算机设备接口任务调度参数关系推理系统可读存储介质处理器分阶段

系统为您推荐了相关专利信息

一种融合场景语义的智能座舱驾驶员意图预测方法及系统

驾驶员意图驾驶员交互融合场景智能座舱深度学习模型

问答检索方法、装置、存储介质以及终端

大语言模型意图类别意图识别问答检索方法数据

超短期光伏功率概率预测的多模态扩散模型的构建及应用

功率图像分支网络线性单元

一种面向战斗力指数定量分析的局部逼近方法

RBF神经网络模糊神经网络隶属度函数模糊逻辑理论训练样本数据

一种基于双层级深度学习算法的粮食杂质检验方法

深度学习算法检验方法 YOLO模型样本网络结构

推理方法、系统、计算机设备及存储介质

站点导航

APP 下载