一种基于模糊语义匹配的大语言模型键值缓存复用方法和系统

AITNT
正文
推荐专利
一种基于模糊语义匹配的大语言模型键值缓存复用方法和系统
申请号:CN202511083124
申请日期:2025-08-04
公开号:CN120994757A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及大语言模型推理技术领域,公开了一种基于模糊语义匹配的大语言模型键值缓存复用方法和系统,方法包括:根据用户的历史推理请求中的词元生成键值缓存,将多个词元聚集成词元块,生成词元块的嵌入向量,建立向量数据库;计算新的推理请求的词元块的嵌入向量与向量数据库中历史嵌入向量的余弦相似度,若存在余弦相似度超过设定阈值的历史词元块,则通过哈希索引获取对应的键值缓存并复用;计算注意力分数,基于所述注意力分数将当前词元块中的多个词元区分为关键词元和非关键词元;对关键词元重新计算键值缓存;对关键词元的重新计算的键值缓存以及对非关键次元复用键值缓存组成混合键值缓存。本发明方法能够在几乎不降低模型精度的前提下,将键值缓存复用技术从精确匹配拓展至模糊语义匹配,有效削减不必要的计算开销,进而提升推理效率。
技术关键词
键值 模糊语义 复用方法 关键词 注意力 词嵌入模型 推理技术 大语言模型 复用技术 索引 计算机系统 新词 存储器 处理器 阶段 解码 精度
系统为您推荐了相关专利信息
1
基于多通道注意力机制的城市场景点云自动语义分割方法、系统、终端及介质
注意力机制 语义分割方法 语义特征 序列化特征 数据
2
基于图神经网络分层结构的知识图谱解释性文本生成方法
文本生成方法 图谱 节点特征 分层 注意力机制
3
音频冲突处理方法、装置、电子设备、系统及存储介质
音频 设备管理模块 控件 指令 电子设备
4
一种低功耗车楼协同通信方法及系统
功率分配模型 功率分配策略 协同通信方法 模型更新 车辆对车辆通信
5
基于LSTM的电网事故处置预案文本相似度匹配方法及系统
语义特征提取 文本 LSTM模型 电力系统安全技术 电网事故预案
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号