基于大语言模型的请求处理方法、装置、设备以及计算机存储介质

AITNT
正文
推荐专利
基于大语言模型的请求处理方法、装置、设备以及计算机存储介质
申请号:CN202510773580
申请日期:2025-06-11
公开号:CN120892173A
公开日期:2025-11-04
类型:发明专利
摘要
本申请公开了基于大语言模型的请求处理方法、装置、设备以及计算机存储介质。所述请求处理方法包括:基于用户端的请求的文本长度和大语言模型的参数量计算请求负载;判断请求负载是否大于或等于预设阈值;若请求负载大于或等于预设阈值,则分发至第一服务器处理,得到第一目标结果和Key‑Value缓存;将Key‑Value缓存更新至缓存数据库,并且将第一目标结果发送至所述用户端。本申请通过将Key‑Value缓存从服务节点中解耦至远程的缓存数据库系统,实现了计算与存储的分离,避免缓存冗余,提升了缓存复用率和一致性管理效率。
技术关键词
大语言模型 服务器 计算机存储介质 数据库系统 存储计算机程序 解码 文本 动态更新 处理单元 处理器 参数 冗余 进程 存储器 标识 节点 序列
系统为您推荐了相关专利信息
1
用于DTP-PMSM全速域开路故障容错运行的PIR控制器及控制方法
故障容错 PIR控制器 绕组 双线性 表达式
2
基于图神经网络的关键节点矢量数据向量化与空间感知方法
神经网络模型 数据 高程差异 地理实体 无监督学习方法
3
基于复杂网络标签传播的图像分割方法及系统
图像分割方法 节点分配标签 邻居 核心 纹理特征
4
一种基于三层边缘计算架构的智能水表识别系统
智能水表 识别系统 水表读数 摄像头模块 数据传输模块
5
一种基于混合引擎的学生学情分析方法及系统
学生学情分析 意图识别 结构化查询语句 生成用户 界面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号