大模型的推理加速方法、设备及存储介质

正文

推荐专利

大模型的推理加速方法、设备及存储介质

申请号：CN202510457550

申请日期：2025-04-11

公开号：CN120525044A

公开日期：2025-08-22

类型：发明专利

摘要

本申请公开了一种大模型的推理加速方法、设备及存储介质，方法包括：将提示信息分别输入至多个不同的小模型中，分别得到每个小模型输出的草稿词元序列；获取每个小模型对应的序列选取数量，分别从每个小模型输出的草稿词元序列中筛选出序列选取数量个草稿词元序列，得到被选中的草稿词元序列；将每个被选中的草稿词元序列输入至大模型进行验证，得到大模型输出的最终词元序列；计算每个小模型对应的正确接收率；基于每个小模型对应的正确接收率，调整每个小模型对应的序列选取数量，可以生成更多的草稿词元序列，且通过正确接收率调整各个小模型的序列选取数量，可以降低无效草稿词元序列造成的计算开销，有效提高大模型的推理速度。

技术关键词

序列语法模型场景周期可读存储介质电子设备处理器程序指令存储器计算机数据参数样本速度

系统为您推荐了相关专利信息

一种基于神经网络去噪的远同源蛋白质搜索方法、系统、终端及存储介质

搜索方法列表隐马尔可夫模型序列矩阵

一种基于大数据的电商运营实训规划系统及方法

规划系统策略仿真模型大数据指标

一种用于导航或机器人髋臼周围截骨的骨刀集成系统

集成系统骨刀髋臼机器人反光球

网络安全访问控制方法、计算设备、计算机可读存储介质

网络安全访问控制方法终端设备网关设备证书验证信息验证

一种光伏电源用电管理方法

光伏电源能量分配策略储能模块管理方法光伏发电量

大模型的推理加速方法、设备及存储介质

站点导航

APP 下载