一种基于大语言模型的推理方法、装置、及电子设备

正文

推荐专利

申请号：CN202510700087

申请日期：2025-05-28

公开号：CN120671811A

公开日期：2025-09-19

类型：发明专利

摘要

本发明实施例公开一种基于大语言模型的推理方法、装置及电子设备，涉及计算机技术领域，能够加快目标序列的形成，提高大语言模型的推理速度。所述方法包括：基于初始输入序列，草稿模型并行生成N个序列的头部词元，其中N为大于2的正整数；将每一个序列的头部词元，分别作为检索词，遍历高频词典树，以在所述高频词典树中检索以所述头部词元为首节点的子序列；将检索到的所述子序列，与对应的头部词元相组合形成以对应头部词元为头部的猜测序列，得到N个猜测序列；使用目标模型对所述N个猜测序列进行验证，从所述N个猜测序列中确定目标序列。本发明适用于基于大语言模型的推理中。

技术关键词

序列推理方法词典大语言模型计算机可读指令电子设备节点推理装置可读存储介质列表分词处理器速度

系统为您推荐了相关专利信息

一种光伏场景智能生成方法及系统

智能生成方法多头注意力机制频率多尺度统计特征

一种异构多模态混合专家适配器

嵌入特征注意力模态特征适配器多模态

基于改进YOLOv8n算法的城市空间混行交通参与者检测模型

位置感知信息阶段智能交通检测技术序列切片注意力机制

一种场景表面重建方法、装置、设备及介质

表面重建方法图像多视角场景三维重建算法

模型训练方法及客流量的预测方法

神经网络模型模型训练方法编码器参数非易失性存储介质注意力

一种基于大语言模型的推理方法、装置、及电子设备

站点导航

APP 下载