一种大语言模型处理系统及会话处理方法

正文

推荐专利

一种大语言模型处理系统及会话处理方法

申请号：CN202511080375

申请日期：2025-08-01

公开号：CN120973527A

公开日期：2025-11-18

类型：发明专利

摘要

本申请实施例提供了一种大语言模型处理系统及会话处理方法。该系统包括：部署调度器的管理节点、计算节点和存储节点，调度器连接存储节点，存储节点用于直接与计算节点的硬件加速器内存进行数据交互；调度器用于接收到会话请求，且会话请求为多轮会话请求，向存储节点发送获取指令；存储节点用于获取会话请求的KV Cache，并将其缓存至存储节点的第一内存；调度器还用于将会话请求发送至计算节点；计算节点用于获取到会话请求后，从存储节点的第一内存获取KV Cache，利用KV Cache处理会话请求，由此，能够消除了跨计算节点获取KV Cache造成的传输延迟，减少了计算节点等待时间，由此提高了硬件加速器的使用率。

技术关键词

节点调度器硬件加速器内存多轮会话大语言模型图像处理器队列指令消息键值分布式系统集群数据

系统为您推荐了相关专利信息

工作流调度方法、装置、设备、存储介质及程序产品

工作流调度方法细菌觅食优化算法混合优化算法遗传优化算法计算机执行指令

一种机器人室内环境感知方法及装置

机器人室内环境感应模块控制模块深度相机激光雷达

基于异构嵌入式的类增量目标检测系统

嵌入式微处理器现场可编程门阵列浮点数样本模块

一种在原子水平智能识别T细胞抗原的方法

相互作用特征交叉注意力机制人工智能模型预测智能识别方法门控循环单元

双起降坪垂直起降场容量评估方法

容量评估方法航空器平面图仿真软件构型

一种大语言模型处理系统及会话处理方法

站点导航

APP 下载