基于LLM提示词的融合缓存方法、系统、设备及介质

正文

推荐专利

申请号：CN202510367407

申请日期：2025-03-26

公开号：CN120277069A

公开日期：2025-07-08

类型：发明专利

摘要

本申请实施例涉及大语言模型技术领域，公开了一种基于LLM提示词的融合缓存方法、系统、设备及介质。将用户输入的提示词转化为嵌入向量并存储于向量数据库中；基于所述向量数据库利用向量检索技术计算新提示词与历史提示词的语义相似性，筛选相似提示词；将LLM大语言模型根据提示词生成的推理结果存储于Redis缓存中；基于所述相似提示词进行检索，快速返回所述Redis缓存中对应的推理结果；将提示词拆分并进行分片存储，针对每个分片独立存储对应的KV Cache。可以至少用以解决大语言模型推理过程中产生的计算资源和显存资源浪费的技术问题。

技术关键词

向量检索技术缓存方法分片计算机程序指令大语言模型语义缓存系统电子设备处理器介质复杂度组织模块索引负担存储器标记动态

系统为您推荐了相关专利信息

一种基于虚拟现实与大语言模型的自适应安全培训系统和方法

培训系统数据采集模块 SQLite数据库 VR头戴式设备语义向量

提示词的确定方法、装置、电子设备以及存储介质

大语言模型决策算法数据指令非暂态计算机可读存储介质

一种智能果园分析管理方法、系统、设备及介质

分析管理方法置信度阈值多任务大语言模型水果图像

知识图谱处理方法、装置、电子设备、存储介质及产品

图谱异常事件推理规则命名实体识别计算机程序指令

图像处理方法、装置、设备及存储介质

插值算法像素点邻域特征点图像处理方法

基于LLM提示词的融合缓存方法、系统、设备及介质

站点导航

APP 下载