基于大语言模型的请求处理方法、装置、设备以及计算机存储介质

正文

推荐专利

申请号：CN202510773580

申请日期：2025-06-11

公开号：CN120892173A

公开日期：2025-11-04

类型：发明专利

摘要

本申请公开了基于大语言模型的请求处理方法、装置、设备以及计算机存储介质。所述请求处理方法包括：基于用户端的请求的文本长度和大语言模型的参数量计算请求负载；判断请求负载是否大于或等于预设阈值；若请求负载大于或等于预设阈值，则分发至第一服务器处理，得到第一目标结果和Key‑Value缓存；将Key‑Value缓存更新至缓存数据库，并且将第一目标结果发送至所述用户端。本申请通过将Key‑Value缓存从服务节点中解耦至远程的缓存数据库系统，实现了计算与存储的分离，避免缓存冗余，提升了缓存复用率和一致性管理效率。

技术关键词

大语言模型服务器计算机存储介质数据库系统存储计算机程序解码文本动态更新处理单元处理器参数冗余进程存储器标识节点序列

系统为您推荐了相关专利信息

用于DTP-PMSM全速域开路故障容错运行的PIR控制器及控制方法

故障容错 PIR控制器绕组双线性表达式

基于图神经网络的关键节点矢量数据向量化与空间感知方法

神经网络模型数据高程差异地理实体无监督学习方法

基于复杂网络标签传播的图像分割方法及系统

图像分割方法节点分配标签邻居核心纹理特征

一种基于三层边缘计算架构的智能水表识别系统

智能水表识别系统水表读数摄像头模块数据传输模块

一种基于混合引擎的学生学情分析方法及系统

学生学情分析意图识别结构化查询语句生成用户界面

基于大语言模型的请求处理方法、装置、设备以及计算机存储介质

站点导航

APP 下载