一种基于模糊语义匹配的大语言模型键值缓存复用方法和系统

正文

推荐专利

申请号：CN202511083124

申请日期：2025-08-04

公开号：CN120994757A

公开日期：2025-11-21

类型：发明专利

摘要

本发明涉及大语言模型推理技术领域，公开了一种基于模糊语义匹配的大语言模型键值缓存复用方法和系统，方法包括：根据用户的历史推理请求中的词元生成键值缓存，将多个词元聚集成词元块，生成词元块的嵌入向量，建立向量数据库；计算新的推理请求的词元块的嵌入向量与向量数据库中历史嵌入向量的余弦相似度，若存在余弦相似度超过设定阈值的历史词元块，则通过哈希索引获取对应的键值缓存并复用；计算注意力分数，基于所述注意力分数将当前词元块中的多个词元区分为关键词元和非关键词元；对关键词元重新计算键值缓存；对关键词元的重新计算的键值缓存以及对非关键次元复用键值缓存组成混合键值缓存。本发明方法能够在几乎不降低模型精度的前提下，将键值缓存复用技术从精确匹配拓展至模糊语义匹配，有效削减不必要的计算开销，进而提升推理效率。

技术关键词

键值模糊语义复用方法关键词注意力词嵌入模型推理技术大语言模型复用技术索引计算机系统新词存储器处理器阶段解码精度

系统为您推荐了相关专利信息

基于多通道注意力机制的城市场景点云自动语义分割方法、系统、终端及介质

注意力机制语义分割方法语义特征序列化特征数据

基于图神经网络分层结构的知识图谱解释性文本生成方法

文本生成方法图谱节点特征分层注意力机制

音频冲突处理方法、装置、电子设备、系统及存储介质

音频设备管理模块控件指令电子设备

一种低功耗车楼协同通信方法及系统

功率分配模型功率分配策略协同通信方法模型更新车辆对车辆通信

基于LSTM的电网事故处置预案文本相似度匹配方法及系统

语义特征提取文本 LSTM模型电力系统安全技术电网事故预案

一种基于模糊语义匹配的大语言模型键值缓存复用方法和系统

站点导航

APP 下载