摘要
本发明提供一种推理重调度方法、装置、设备及可读存储介质。应用于包括推理调度器和多个推理服务器的推理调度系统。方法包括:在推理调度器与服务注册中心合设的情况下,基于每个推理服务器上报的负载状态信息,确定待重调度的第一推理服务器以及接收重调度的目标推理服务器;在推理调度器与推理服务器的流量网关合设的情况下,基于推理调度器记录的每个推理服务器的请求处理信息,确定待重调度的第一推理服务器以及接收重调度的目标推理服务器;基于第一推理服务器的请求排队时间信息,以及目标推理服务器的请求数量信息,将第一推理服务器的待重调度请求发送给目标推理服务器。本申请提升了推理重调度的整体性能。
技术关键词
推理服务器
重调度方法
负载状态信息
服务注册中心
调度器
调度系统
计算机程序产品
处理器
网关
队列
调度装置
存储器
电子设备
模块
介质
数据
系统为您推荐了相关专利信息
汽车自动驾驶
标注系统
图片
筛选器
双曲正切函数
分布式数据采集
策略
节流控制器
防护体系
分布式混合架构
异构
资源控制器
资源调度器
资源定义
资源状态信息
工作量证明
防御系统
身份验证
非暂态计算机可读存储介质
应用服务器