端云LLM混合服务框架下端侧LLM的优化方法

正文

推荐专利

申请号：CN202410744787

申请日期：2024-06-11

公开号：CN118747166B

公开日期：2025-03-07

类型：发明专利

摘要

一种端云LLM混合服务框架下端侧LLM的优化方法，通过终端收集用户和云侧LLM的历史交互数据并构建外部数据库后，评估其中每个元素的价值并生成最优数据库子集；当收到用户输入时，终端将端侧LLM的生成结果和在最优数据库子集中的k‑近邻检索结果加权得到端侧回复结果，实现推理增强。本发明通过使用用户和云侧的历史交互记录建立外部数据库以显著提升端侧LLM生成质量，并通过离线和在线子集选择算法进行数据库压缩，二者都有接近(1‑1/e)的近似比保证，带来的困惑度(PPL)下降多于其他数据库压缩算法。

技术关键词

框架数据终端离线在线压缩算法话题编码序列元素

系统为您推荐了相关专利信息

参数搜索方法、装置、电子设备、存储介质和芯片

参数搜索方法数据处理器计算机程序指令搜索场景

一种基于生成对抗网络的半监督图像翻译方法

图像翻译方法生成对抗网络翻译模型注意力机制阶段

一种基于图编码器和序列解码器的加工特征识别方法

预测网络模型特征识别方法三维CAD模型序列编码器

空调控制方法、电子设备及光伏空调

空调工作状态空调控制方法空调运行状态压缩机循环神经网络模型

一种基于数据分析的艺术设计评价系统

图像特征数据评价系统艺术家图像特征提取信息熵

端云LLM混合服务框架下端侧LLM的优化方法

站点导航

APP 下载