推理请求的调度方法、装置、电子设备与可读存储介质

正文

推荐专利

申请号：CN202510820117

申请日期：2025-06-18

公开号：CN120768951A

公开日期：2025-10-10

类型：发明专利

摘要

本公开提供一种推理请求的调度方法、装置、电子设备与可读存储介质，涉及大模型、深度学习、云服务等人工智能技术领域。其中，推理请求的调度方法包括：接收多个推理服务分别发送的指标元数据；根据所述指标元数据，得到每个推理服务的负载水平；响应于接收到目标推理服务发送的处理请求，采用与所述目标推理服务的负载水平对应的调度策略，向所述目标推理服务调度推理请求。本公开能够提升推理请求的调度准确性，进而使得多个推理服务的负载更加均衡，有效地降低在得到推理结果时的平均时延。

技术关键词

指标数据策略电子设备人工智能技术计算机程序产品队列调度装置处理器通信指令可读存储介质处理单元存储器时延

推理请求的调度方法、装置、电子设备与可读存储介质

站点导航

APP 下载