用户请求处理方法、大模型服务系统、设备以及存储介质

正文

推荐专利

申请号：CN202510579211

申请日期：2025-05-06

公开号：CN120596245A

公开日期：2025-09-05

类型：发明专利

摘要

本公开提供了一种用户请求处理方法、大模型服务系统、设备以及存储介质，涉及计算机技术领域，尤其涉及人工智能、大语言模型等技术领域。具体实现方案为：接收第一用户请求；对该第一用户请求进行分词，以得到该第一用户请求对应的分词序列；根据该分词序列，确定该第一用户请求的可复用的键值对缓存；在该可复用的键值对缓存处于从GPU向CPU传输过程中的情况下，停止传输该可复用的键值对缓存，并将该可复用的键值对缓存分配给该第一用户请求。本公开能够提升用户请求的处理效率。

技术关键词

键值图像处理器中央处理器分词服务系统序列资源大语言模型计算机程序产品尺寸处理器通信指令可读存储介质存储器逻辑基准电子设备关系

用户请求处理方法、大模型服务系统、设备以及存储介质

站点导航

APP 下载