用于大语言模型的推理方法、装置、设备和介质

正文

推荐专利

申请号：CN202510551114

申请日期：2025-04-29

公开号：CN120469800A

公开日期：2025-08-12

类型：发明专利

摘要

本公开提供一种用于大语言模型的推理方法、装置、设备和介质，属于人工智能技术领域。该方法包括：利用CPU和GPU协同完成多次迭代，每次迭代包括：第一任务，用于在CPU确定未完成的多个序列及其最后生成的词元标识；第二任务，用于在CPU基于多个序列最后生成的词元标识确定模型输入；第三任务，用于在GPU计算多个序列的待生成的下一词元的概率分布；第四任务，用于在GPU进行采样，以得到下一词元的标识；以及第五任务，用于在CPU基于下一词元的标识，更新多个序列的完成状态，其中，第n+1次迭代和第n次迭代异步执行，第n+1次迭代的第一任务和第二任务与第n次迭代的第三任务并行执行，第n+1次迭代的第三任务和第n次迭代的第五任务并行执行。

技术关键词

序列标识大语言模型进程推理方法处理单元索引解码处理器推理装置人工智能技术计算机程序产品模运算计算机设备数据可读存储介质存储器

系统为您推荐了相关专利信息

车辆控制方法、装置、计算机设备和可读存储介质

参数优化模型车辆控制单元验证平台数字孪生车辆控制方法

BERT模型的训练方法、系统、计算机设备、存储介质及程序产品

BERT模型样本序列计算机可执行指令 sigmoid函数

智能导视方位标识方法

标识方法指示标志智能导视系统定位系统数据可视化显示

一种增强图数据库图计算能力的方法、装置、设备及介质

分区策略算法数据计算技术传输器节点

半导体器件电性参数预测方法、电子设备和存储介质

大尺寸器件参数预测方法小尺寸器件半导体器件神经网络模型

用于大语言模型的推理方法、装置、设备和介质

站点导航

APP 下载