基于LLM提示词的融合缓存方法、系统、设备及介质

AITNT
正文
推荐专利
基于LLM提示词的融合缓存方法、系统、设备及介质
申请号:CN202510367407
申请日期:2025-03-26
公开号:CN120277069A
公开日期:2025-07-08
类型:发明专利
摘要
本申请实施例涉及大语言模型技术领域,公开了一种基于LLM提示词的融合缓存方法、系统、设备及介质。将用户输入的提示词转化为嵌入向量并存储于向量数据库中;基于所述向量数据库利用向量检索技术计算新提示词与历史提示词的语义相似性,筛选相似提示词;将LLM大语言模型根据提示词生成的推理结果存储于Redis缓存中;基于所述相似提示词进行检索,快速返回所述Redis缓存中对应的推理结果;将提示词拆分并进行分片存储,针对每个分片独立存储对应的KV Cache。可以至少用以解决大语言模型推理过程中产生的计算资源和显存资源浪费的技术问题。
技术关键词
向量检索技术 缓存方法 分片 计算机程序指令 大语言模型 语义 缓存系统 电子设备 处理器 介质 复杂度 组织 模块 索引 负担 存储器 标记 动态
系统为您推荐了相关专利信息
1
一种基于虚拟现实与大语言模型的自适应安全培训系统和方法
培训系统 数据采集模块 SQLite数据库 VR头戴式设备 语义向量
2
提示词的确定方法、装置、电子设备以及存储介质
大语言模型 决策算法 数据 指令 非暂态计算机可读存储介质
3
一种智能果园分析管理方法、系统、设备及介质
分析管理方法 置信度阈值 多任务 大语言模型 水果图像
4
知识图谱处理方法、装置、电子设备、存储介质及产品
图谱 异常事件 推理规则 命名实体识别 计算机程序指令
5
图像处理方法、装置、设备及存储介质
插值算法 像素点 邻域 特征点 图像处理方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号