一种大语言模型下的动态推理方法和系统

正文

推荐专利

一种大语言模型下的动态推理方法和系统

申请号：CN202411566454

申请日期：2024-11-05

公开号：CN119150863B

公开日期：2025-03-18

类型：发明专利

摘要

针对用户输入的多样性以及大语言模型在处理复杂和简单查询时的资源消耗差异问题，本发明提出了一种大语言模型下的动态推理方法和系统，通过将用户输入的提示语句进行分词处理，并利用两个不同的识别模型分别计算每个分词的匹配度，进而计算出推理控制因子。该推理控制因子用于指导大语言模型内部的动态推理过程，具体是通过调整Key‑Value缓存的管理策略来实现的。在当前token与上下文token之间的相对距离超过由推理控制因子确定的范围时，相关的Key和Value会被从缓存中移除。这种方法有效地平衡了存储空间的使用和推理效率，使得大语言模型能够根据不同类型的用户输入动态调整其内部资源分配，从而提高了整体的响应速度和准确性。

技术关键词

动态推理方法大语言模型分词语句因子分布式内存数据库神经网络模型动态更新交互性可读存储介质模块管理策略文本资源分配计算机处理器界面样本阶段

系统为您推荐了相关专利信息

一种河流开发下的生态环境舆情分析方法

舆情分析方法情感分析模型关键词语义河流生态环境

基于医疗物流仓库的多AGV动态路径规划方法及装置

动态路径规划方法物流仓库启发式信息 AGV路径规划物流自动化控制技术

一种基于混合量化精度键值缓存的自注意力机制计算结构

注意力机制矩阵键值精度周期

一种轴承游隙动态测量方法及系统

动态测量方法滚珠轴承径向游隙计算机程序指令掩膜

指标异动归因分析方法、装置、计算机设备及存储介质

归因指标分析方法计算机可读指令意图

一种大语言模型下的动态推理方法和系统

站点导航

APP 下载