基于大语言模型的推理方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410974515

申请日期：2024-07-19

公开号：CN119168054A

公开日期：2024-12-20

类型：发明专利

摘要

本申请提供一种基于大语言模型的推理方法、装置、电子设备及存储介质。该方法包括：将接收到的推理请求发送给云端，以使云端基于第一模型生成推理请求对应的键值缓存，并对键值缓存进行量化获得第一量化后的键值缓存；接收云端返回的第一量化后的键值缓存，基于第一量化后的键值缓存和第二模型生成推理请求对应的候选token序列；向云端发送候选token序列，以使云端利用键值缓存和第一模型对候选token序列进行验证，获得推理结果。本申请实施例通过在云端部署参数量大的模型，在移动终端部署参数量小的模型，在移动终端接收到推理请求后，与云端协同处理，最终给出推理结果，提高了推理的准确性。

技术关键词

键值移动终端云端大语言模型推理方法序列计算机程序指令电子设备处理器推理系统计算机程序产品存储器加密数据

系统为您推荐了相关专利信息

基于二级模糊控制的柑橘育苗智能潮汐灌溉方法及系统

柑橘育苗灌溉方法二级模糊控制模糊控制技术传感器

基于通讯状态的数据传输防护系统及方法

状态监测模块防护系统通讯云端数据同步加密解密模块

基于小波变换和Informer模型的城市污水水质预测方法及系统

水质预测方法序列数据滑动窗口方法建立预测模型

一种基于自适应上下文学习的因果事理图谱形成模型构建方法

事理图谱模型构建方法大语言模型三元组序列

更新代码的方法、装置、设备、存储介质及程序产品

控件大语言模型标识符代码更新图像

基于大语言模型的推理方法、装置、电子设备及存储介质

站点导航

APP 下载