用于大语言模型的推理方法、装置、设备和介质

AITNT
正文
推荐专利
用于大语言模型的推理方法、装置、设备和介质
申请号:CN202510551114
申请日期:2025-04-29
公开号:CN120469800A
公开日期:2025-08-12
类型:发明专利
摘要
本公开提供一种用于大语言模型的推理方法、装置、设备和介质,属于人工智能技术领域。该方法包括:利用CPU和GPU协同完成多次迭代,每次迭代包括:第一任务,用于在CPU确定未完成的多个序列及其最后生成的词元标识;第二任务,用于在CPU基于多个序列最后生成的词元标识确定模型输入;第三任务,用于在GPU计算多个序列的待生成的下一词元的概率分布;第四任务,用于在GPU进行采样,以得到下一词元的标识;以及第五任务,用于在CPU基于下一词元的标识,更新多个序列的完成状态,其中,第n+1次迭代和第n次迭代异步执行,第n+1次迭代的第一任务和第二任务与第n次迭代的第三任务并行执行,第n+1次迭代的第三任务和第n次迭代的第五任务并行执行。
技术关键词
序列 标识 大语言模型 进程 推理方法 处理单元 索引 解码 处理器 推理装置 人工智能技术 计算机程序产品 模运算 计算机设备 数据 可读存储介质 存储器
系统为您推荐了相关专利信息
1
车辆控制方法、装置、计算机设备和可读存储介质
参数优化模型 车辆控制单元 验证平台 数字孪生 车辆控制方法
2
BERT模型的训练方法、系统、计算机设备、存储介质及程序产品
BERT模型 样本 序列 计算机可执行指令 sigmoid函数
3
智能导视方位标识方法
标识方法 指示标志 智能导视系统 定位系统 数据可视化显示
4
一种增强图数据库图计算能力的方法、装置、设备及介质
分区策略 算法 数据计算技术 传输器 节点
5
半导体器件电性参数预测方法、电子设备和存储介质
大尺寸器件 参数预测方法 小尺寸器件 半导体器件 神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号