模型推理调度方法及系统、电子设备和存储介质

正文

推荐专利

申请号：CN202511415359

申请日期：2025-09-29

公开号：CN120909737B

公开日期：2025-12-09

类型：发明专利

摘要

本公开提供了一种模型推理调度方法及系统、电子设备和存储介质，该系统包括多个预填充服务器节点和多个解码服务器节点，方法包括：响应于接收到用户请求信息，结合基于深度强化学习的预填充调度模型，获取从多个预填充服务器节点中选择的目标预填充服务器节点和第一优先级；向目标预填充服务器节点中的与第一优先级对应的请求队列发送预填充请求，令目标预填充服务器节点处理预填充请求；预填充请求处理完成，结合基于深度强化学习的解码调度模型，获取从多个解码服务器节点中选择的目标解码服务器节点和第二优先级；向目标解码服务器节点中的与第二优先级对应的请求队列发送解码请求，令目标解码服务器节点处理解码请求；提升推理效率。

技术关键词

服务器节点解码服务器深度强化学习时间预测模型多级反馈队列策略键值数据训练神经网络调度系统电子设备计算机程序产品参数处理器通信